#apache

2021-6-9 8:36
Superset 1.1.0继续构建1.0版本,并提高用户体验,安全性,仪表板级别访问和数据库连接。 通常,超集用户体验的质量,可用性和美学在SIP-34的方向上继续开发,并且已经向UI组件添加了更多的测试以确保维持可用性。 包含在超集中的ECHARTS库也将突破至5.0.2,其中包括对饼图的一些修复。可......
Apache Arrow 4.0.0 Release(arrow.apache.org)
2021-5-6 1:13
Warning: Can only detect less than 5000 characters
The Apache Attic(attic.apache.org)
2021-4-9 23:6
Apache Attic是在2008年11月创建的,以提供过程和解决方案,以便在Apache项目达到生命结束时清楚。特别是: "负责监督否则不会监督的项目;并进一步......没有被授权在其监督和第34期间积极发展和发布项目; 项目可以进入阁楼的预期机制。管理项目管理委员会(PMC)要么决定要移动项目......
2021-3-11 2:38
VAEX DataFrame一直非常快。从地面上构建的核心(磁盘的大小是限制),它推动了在大数据分析的上下文中可以做的单个机器的限制。从版本2开始,我们为字符串添加了更好的支持数据,与熊猫相比,近1000倍的加速。为了支持这一看似微不足道的数据类型,我们必须选择磁盘和内存格式,并且不想重新发明轮子。 Apache a......
Apache Arrow 3.0(arrow.apache.org)
2021-2-6 19:47
Warning: Can only detect less than 5000 characters
2020-11-25 5:21
随着数据处理管道的数量和复杂性的增加,您可以通过将其分解为一系列较小的任务并协调这些任务作为工作流一部分的执行来简化整个过程。为此,许多开发人员和数据工程师使用由社区创建的Apache Airflow这个平台,以编程方式编写,安排和监视工作流。借助Airflow,您可以将工作流程作为脚本进行管理,通过用户界面(UI)......
2020-11-7 18:11
对于整个Apache Arrow项目(发行说明),特别是Rust子项目,Apache Arrow 2.0.0是一个重要的发行版,15个贡献者解决了近200个问题。在这篇博客文章中,我们将介绍影响核心箭头、Parquet支持和DataFusion查询引擎的主要更改。可在此处找到已解决问题的完整列表。虽然Java和C/C......
2020-10-27 1:47
最近,Posh的平台团队一直在构建一个分析仪表板,以帮助我们的业务用户可视化产品使用情况。Posh的主要产品是客户服务聊天机器人,因此我们的分析仪表板允许我们的业务用户分析我们的机器人为客户提供的服务有多好。作为这个分析仪表板的一部分,我们需要构建一个数据管道来实时处理和存储用户事件。 我们的数据管道是使用Apach......
1M Cell Minesweeper(bl.ocks.org)
2020-10-14 13:46
根据Apache许可证2.0版发布。
2020-8-29 6:19
Apache Spark是一个用于大规模分布式数据处理的开源统一分析引擎。在过去的几年中,它已经成为用于处理大量数据的最流行的工具之一。它涵盖了广泛的任务-从数据批处理和简单的ETL(提取/转换/加载)到流和机器学习。 由于Kotlin与Java的互操作性,Kotlin开发人员已经可以通过Java API使用Apac......
Apache Solr 8.6.1 Released(mail-archives.apache.org)
2020-8-16 18:40
-BEGIN PGP Signed Message-Hash:SHA256 Lucene PMC很高兴地宣布发布Apache Solr 8.6.1。Solr是Apache Lucene项目推出的广受欢迎、速度极快的开源NoSQL搜索平台。它的主要功能包括强大的全文搜索、点击突出显示、分面搜索、动态集群、数据库集成、富......
Apache Kafka 2.6 Updates(www.confluent.io)
2020-8-7 2:32
我很高兴代表Apache Kafka®社区宣布Apache Kafka 2.6.0的发布。这是另一个具有许多新功能和改进的激动人心的版本。我们将在这篇博客文章中重点介绍一些更突出的特性,但请参阅发行说明以获取完整的更改列表。 我们在此版本中进行了相当多的性能改进,特别是当代理具有更大的分区计数时。代理关闭性能显著提高......
Apache Arrow 1.0.0 Released(arrow.apache.org)
2020-7-27 23:28
Apache Arrow团队很高兴地宣布发布了1.0.0版本。这涵盖了超过3个月的开发工作,包括来自100个不同贡献者的810个已解决的问题。请参阅安装页以了解如何获取适用于您的平台的库。尽管是“1.0.0”版本,但这是Apache Arrow的第18个主要版本,标志着向柱状格式(早在2017年12月就已经非正式地向......
2020-7-4 7:33
就在短短几个月前,对于我们中的大多数人来说,日常工作包括去办公室操作公司的计算机,或者直接将笔记本电脑插入公司网络。有时,我们在远程工作时需要特殊的网络访问权限,无论是通过VPN还是使用众多远程连接工具中的一种。 但众所周知,我们现在正处于后新冠肺炎时代的“新常态”,许多人的大部分工作都是在家里完成的。Check P......
2020-7-3 1:59
就在短短几个月前,对于我们中的大多数人来说,日常工作包括去办公室操作公司的计算机,或者直接将笔记本电脑插入公司网络。有时,我们在远程工作时需要特殊的网络访问权限,无论是通过VPN还是使用众多远程连接工具中的一种。 但众所周知,我们现在正处于后新冠肺炎时代的“新常态”,许多人的大部分工作都是在家里完成的。Check P......
2020-5-29 21:22
Airflow是一个由社区创建的平台,用于以编程方式编写、计划和监控工作流。 机器学习是业界的热门话题。如果不是涉及到数据处理,它就不会这么酷。 假设您有一个执行Twitter情感分析的ML模型。现在,您想要在Twitter上为您最喜欢的人每天的tweet运行该模型。这样的工作流应该是这样的。 如您所见,数据从管道的......
2020-5-22 1:47
Apache Druid社区在2020年4月20日发布了Druid 0.18。此版本包含来自42个贡献者的200多个新功能、性能增强、错误修复和主要文档改进。 像往常一样,您可以访问Apache Druid下载页面下载该软件,并阅读详细介绍每个更改的完整发行说明。这个德鲁伊版本也可以作为Impline发行版的一部分提......
Apache NiFi(nifi.apache.org)
2020-5-12 1:38
Apache NiFi支持强大且可伸缩的数据路由、转换和系统中介逻辑有向图。Apache NiFi的一些高级功能和目标包括: