Julia用户最有可能叛逃到Python进行数据科学

2020-08-27 15:08:34

面向数据科学家的编程语言Julia背后的开源项目揭示了,如果用户决定不再使用Julia,他们将转向哪些语言。

朱莉娅,一种植根于麻省理工学院的活泼的编程语言,已经公布了2020年年度用户调查的结果。这项研究旨在揭示那些用这种语言编写程序的人的偏好。今年,这项调查吸引了2565名Julia用户和开发者,高于2019年的1844名参与者。

Python是一种在机器学习应用方面与数据科学家建立了很强亲和力的语言,如果Julia开发人员需要另一种语言,它是绝大多数人会求助的语言。

不管您查看哪个流行指数,Python都在前三名之列,它的流行是由数据科学家和对机器学习应用程序日益增长的需求推动的,再加上丰富的Python模块,这些模块帮助扩展了它在各个领域的使用。

但是,被开发分析公司RedMonk评为值得关注的语言的Julia,背后也有相当多的支持。除了语言的商业化方面的Julia Computing,还有麻省理工学院计算机科学与人工智能实验室(CSAIL)的Julia实验室和一个致力于长期成功的开源社区。

去年,73%的Julia用户表示,如果不使用Julia,他们会使用Python,但今年76%的用户选择Python作为另一种语言。

在统计分析领域,Julia的另一个竞争对手MATLAB在过去的一年里看到其作为顶级替代语言的Julia用户的份额从35%下降到31%,但C++在这一指标上的份额从28%上升到31%。

与此同时,R,一种受欢迎的统计编程语言,拥有忠实的人群,也从27%下降到25%。

其中一些趋势看起来对Julia的长期生存是积极的,尽管Python作为数据科学家的首选语言带来了威胁。

在Julia之后最常用的语言是Python,然后是Bash/Shell/PowerShell。如果2012年出现的Julia不存在,那么大多数Julia用户将会使用C++、MATLAB、R、C、Fortran、Bash/Shell/PowerShell和MATHEMICA。

Julia的用户还透露了他们对这种编程语言的喜爱和厌恶之处,Julia的支持者声称,对于使用CSV文件进行大数据分析,比如查看股价状态和分析抵押贷款风险,这种编程语言比Python和R更快。

最受欢迎的特性包括速度和性能、易用性、开源状态,以及解决有关使用两种语言的问题的能力。对它有利的非技术原因是它是免费的,有一个活跃的开发者社区,而且它是在麻省理工学院的许可下提供的,而为Julia创建软件包应该很容易。

朱莉娅用户报告的缺点是生成第一个情节太慢,编译时间也很慢。此外,也有人抱怨软件包还不够成熟--这是Python生态系统的一个关键区别--而且开发人员无法生成自包含的二进制文件或库。

由于同事和合作者使用其他语言,朱莉娅还面临着收养障碍。Rust是另一种流行于系统编程的现代语言,它在用户中也遇到了类似的采用障碍,因为他们工作的公司并不使用它。