科学论文已过时(2018)

2020-05-24 06:48:49

纸--它的实际形式--是使现代性成为可能的发明之一。在它在17世纪发展起来之前,结果是私下通过信件、短暂的演讲或一次在书中传达的。没有循序渐进的公共论坛。通过为单个实验或微小技术进步的报道腾出空间,期刊使科学的混乱局面愈演愈烈。从那时起,科学家们就变得像群居昆虫一样:作为嗡嗡作响的群体,他们稳步前进。

早期的报纸在某些方面比今天的报纸更具可读性。他们不那么专业,更直接,更简短,也远没有那么正式。微积分刚刚发明不久。整个数据集可以放在单个页面上的表格中。对结果贡献很小的“计算”都是手工完成的,也可以用同样的方式进行验证。

科学越复杂,交流成果就越困难。今天的报纸比以往任何时候都要长,充满了行话和符号。它们依赖于一系列计算机程序,这些程序生成数据、清理数据、绘制数据并对数据运行统计模型。这些程序往往既写得如此草率,又是结果的核心,以至于导致了复制危机,或者换一种说法,就是论文未能完成最基本的任务:报告你实际发现的东西,足够清楚,以至于其他人可以自己发现。

也许这份报纸本身就是罪魁祸首。科学方法现在以软件的速度发展;物理学家、生物学家、化学家、地质学家,甚至人类学家和研究心理学家最需要的技能是熟练使用编程语言和“数据科学”软件包。然而,400年来,传播科学成果的基本方式没有改变。论文可能会发布在网上,但它们仍然是页面上的文本和图片。

如果你今天从头开始设计这篇科学论文,你会得到什么?不久前,我采访了布雷特·维克多(Bret Victor),他是一名研究员,曾在苹果公司(Apple)研究iPad的早期用户界面原型,现在他在加利福尼亚州奥克兰经营着自己的实验室,研究计算的未来。维克多长期以来一直相信,科学家们还没有充分利用计算机。他说:“这与研究印刷机和这本书的演变没有太大不同。”在谷登堡之后,印刷机主要用来模仿圣经中的书法。发明这本现代书籍花了近100年的时间进行技术和概念上的改进。“有一整段时间,他们有了新的印刷技术,但他们只是用它来模仿旧媒体。”

维克多在重新设计邓肯·瓦茨和史蒂文·斯特罗盖茨的一篇期刊文章“小世界网络的集体动态”时,对可能的可能性做了个手势。他之所以选择它,既是因为它是所有科学中被引用最多的论文之一,也是因为它是一个清晰阐述的典范。(斯特罗加茨最出名的是为“纽约时报”撰写备受欢迎的“数学原理”专栏。)。

瓦茨-斯特罗卡茨的论文用文字、图片和数学符号描述了它的主要发现,就像大多数论文做的那样。和大多数论文一样,这些发现仍然令人难以接受,尽管有清晰的散文。最难的部分是描述程序或算法的部分,因为正如维克多所说,这需要读者在脑海中“玩计算机”,也就是说,努力保持对算法每一步发生的脆弱的心理图景。

维克多的重新设计将说明性文本与说明每个步骤的小互动图表交织在一起。在他的版本中,你可以看到算法在一个例子中起作用。你甚至可以自己控制它。

斯特罗卡茨钦佩维克多的设计。他后来告诉我,令人遗憾的是,在数学领域,几百年来一直有一个传统,就是把论文写得尽可能正式和朴素,往往压抑了数学家用来做出发现的视觉辅助工具。

斯特罗加茨研究非线性动力学和混沌,即进入同步或自组织状态的系统:萤火虫闪烁,节拍器滴答作响,心脏细胞发出电脉冲。关键是这些系统会经历循环,斯特罗加茨将其视觉化为围绕圆圈运行的圆点:当一个圆点回到它开始的地方时,那就是萤火虫闪烁或心脏细胞放电。他说:“大约25年来,我一直在制作围绕圆圈运行的圆点的电脑动画,用颜色表示它们的频率。”“红色的是慢的,紫色的是快的……。我的电脑上有这些彩色的圆点在打转。我整天都在做这件事,“他说。“在屏幕上运行、移动的彩色圆点中,我能比同时观察500个时间序列时更容易看到图案。”我看不太清楚那样的东西。因为事情不是看上去的那样.。我正在研究的是一些动态的东西。所以表示应该是动态的。“。

软件是一种动态的媒介,而纸张不是。如果你这么想,你会觉得奇怪的是,像斯特罗加茨的动力系统研究这样的研究经常被分享在纸上,而没有他的小旋转点的好处-因为是旋转点帮助他看到了他看到的东西,这可能也有助于读者看到它。

当然,简而言之,这就是科学传播的全部问题:在计算机的帮助下,今天的科学成果往往是发现不了的。这是因为这些想法是复杂的、动态的,很难在你的脑海中抓住。然而,到目前为止,我们拥有的用于传达这些结果的最流行的工具是PDF-字面上是对一张纸的模拟。也许我们可以做得更好。

S在他15岁的时候发表了他的第一篇科学论文。当他完成大学生涯的时候,他已经发表了10篇论文。到他20岁的时候,也就是1980年,他已经完成了加州理工学院的粒子物理学博士学位。他的秘密武器是他对计算机的拥护,当时大多数严肃的科学家都认为计算工作不如他们。“在这一点上,我认为我是世界上最大的计算机代数用户,”他在一次演讲中说。“它是如此的整洁,因为我可以很容易地计算出所有这些东西。我过去喜欢在我的物理论文中放入令人难以置信的华丽公式。“。

随着他的研究变得更加雄心勃勃,他发现自己把现有的软件推向了极限。在一个项目的过程中,他必须使用六个编程工具。“我花了很多时间把这些东西粘在一起,”他说。“我的决定是,我应该试着建立一个单一的系统,只做我想做的所有事情--而且我可以期待永远保持增长。”Wolfram决定成立一家名为Wolfram Research的公司,为科学家构建完美的计算环境,而不是继续做一名学者。1988年4月18日版“福布斯”的头条是这样宣布的:“物理伟人进军商界。”

作为该公司的旗舰产品,MATHEMICA的核心是一个“笔记本”,你可以在一行输入命令,然后在下一行看到结果。输入“1/6+2/5”,系统会显示“17/30”。要求它因式一个多项式,它就会照办。数学会做微积分、数论、几何、代数。但它也有功能,可以计算化学物质将如何反应,或过滤基因组数据。它的知识库中几乎有伦勃朗全部作品中的每一幅画,可以给你一个他的调色板随时间的散点图。它有一个内置的轨道力学模型,可以告诉你如果F/A-18的发动机在32000英尺的高空熄火,F/A-18大黄蜂将滑行多远。一本数学笔记本与其说是用户计算的记录,不如说是他们与博学神谕对话的文字记录。沃尔弗拉姆称精心创作的数学笔记本为“计算散文”。

笔记本界面是西奥多·格雷(Theodore Gray)的创意,他是在与一位老苹果代码编辑器合作时受到启发的。在大多数编程环境中,您要么一次运行一行代码,要么一次性运行一个大的BLOB代码,而Apple编辑器允许您突出显示代码的任何部分并只运行该部分。格雷在史蒂夫·乔布斯的帮助下,将同样的基本概念带到了MATHEMICAL a中,改进了设计。这款笔记本旨在将科学编程转变为互动练习,根据作者从他们的小计算实验结果中了解到的那样,单个命令可能会被微调和重新运行几十次或数百次,并对他们的数据有了更深入的理解。

数学笔记本之所以特别适合这项任务,是因为它能够生成曲线图、图片和漂亮的数学公式,并使输出对代码中的更改做出动态响应。在MATHEMICA中,您可以输入语音记录,对音频运行复杂的数学过滤器,并将生成的声波可视化;只需通过鼠标移动和调整参数,您就可以扭曲波形,通过播放发现哪些过滤器工作得最好。Gray说,MATHEMICAL能够在一个简单的界面上流畅地处理这么多不同类型的计算,是“人类几个世纪的努力”的结果。

推动这项工作的愿景,像福音一样被Wolfram在他的许多演讲、博客帖子、截屏和新闻稿中重申,不仅是为了制作一款优秀的软件,而且是为了在科学事业本身创造一个拐点。在17世纪中期,戈特弗里德·莱布尼茨设计了一种积分和导数的符号(熟悉的∫和dx/dt),使得微积分中的困难概念几乎是机械化的。莱布尼茨发展了这样一种感觉,即更广泛地应用类似的符号可以创造出一种“思想代数”。从那时起,逻辑学家和语言学家一直渴望一种通用语言,这种语言可以消除歧义,将各种复杂问题的解决变成一种微积分。

Wolfram的职业生涯一直致力于将世界上的知识真空化到MATHEMICAL a中,后来又通过Wolfram Alpha实现访问。Wolfram Alpha是该公司的“计算知识引擎”,为Siri和Alexa的许多问答功能提供动力。这是Wolfram自己试图创建一种中间语言,一种人类和机器都能理解的编程语言,一种无所不包的代数。

这是一个典型的雄心壮志。在20世纪90年代,沃尔夫勒姆偶尔会在公开评论中开玩笑说,在他建立公司的同时,他正在悄悄地从事一个革命性的科学项目,这个项目已经酝酿了多年。期待建立起来了。然后,最终,这件事本身就来了:一本像煤渣块一样宽,几乎一样重的巨型书,书名是“一种新的科学”(A New Kind Of Science),这是一个时代的书名。

事实证明,这是一项在数学笔记本上进行的详细研究,研究了由简单的计算过程(称为细胞自动机)产生的令人惊讶的复杂模式,这既是为了它们本身,也是为了理解简单的规则是如何产生自然界中的复杂现象的,比如龙卷风或软体动物壳上的模式。Wolfram在没有同行评审的情况下发表了这些探索,每隔几页就会附带提醒,告诉他们它们有多重要。

你遇到的沃尔夫拉姆越多,这似乎就越是他的本性。1988年“福布斯”对他的介绍试图找出问题的根源:“用新泽西州(普林斯顿)著名的高级研究所(Institute For Advanced Study)前所长哈里·伍尔夫(Harry Woolf)的话说--23岁的沃尔夫勒姆是那里有史以来最年轻的高级研究人员之一--他‘培养出来的性格困难增加了一种与生俱来的孤独感’。”

当Wolfram的一名研究助理在一次会议上宣布了一项重大的数学发现时,这是“一种新的科学”的核心部分,Wolfram威胁说,如果东道主发表了这项发现,就会起诉他们。他当时说:“你不会找到任何严肃的研究小组,让初级研究人员告诉高级研究人员正在做什么。”沃尔弗拉姆的这本巨著受到了学者们的严厉批评,因为它是其他作品的衍生品,但在归属上却很吝啬。2002年,一位研究员告诉“泰晤士报高等教育”:“他暗示,他在很大程度上要对20年来一直是复杂系统理论中心教条的基本思想负责。”

沃尔弗拉姆的自吹自擂尤其令人恼火,因为它似乎没有必要。他的成就不言而喻--只要他允许。MATHEMICAL几乎一推出就大获成功。用户非常渴望它;在大学里,这个程序很快就像Microsoft Word一样无处不在。反过来,Wolfram利用稳定的收入聘请了更多的工程师和主题专家,为他永不满足的计划提供了越来越多的信息。今天,MATHEMICA知道脚的解剖学和物理定律;它知道音乐、针叶树的分类学,以及第一次世界大战的主要战斗。沃尔夫拉姆本人帮助教授了这个程序一种古希腊数字符号。

所有这些知识都是“可计算的”:如果你愿意,你可以将“x”设置为索姆河战役的位置,将“y”设置为1916年该点半径30英里范围内的日降雨量,并使用MATHEMICA来查看第一次世界大战的战斗在雨中是更致命还是更不致命。

“我注意到一个有趣的趋势,”Wolfram在一篇博客文章中写道。“选择任何一个领域X,从考古学到动物学。要么现在有一个“计算性X”,要么很快就会有。它被广泛视为该领域的未来。“。Wolfram认为,随着这些领域的实践者对计算变得更加精通,他们将极大地扩大可发现的范围。数学笔记本可以成为科学的助推剂,因为它可以催生一种新的思维方式。“真正让人兴奋的地方,”他说,“就像17世纪人们开始能够阅读数学符号时一样的过渡。”它变成了一种交流的形式,它有一个极其重要的额外部分,那就是你也可以实际运行它。“。

我们的想法是,这种“论文”将具有斯特罗加茨和维克多想要的所有动态性--文本中交错的交互式图表--另外的好处是,所有生成这些图表的代码及其背后的数据,都将在那里供读者查看和操作。“坦率地说,当你在笔记本上做一些漂亮的干净的Wolfram语言的事情时,那里不会有废话。这就是它的本来面目,它做它该做的事。沃尔弗拉姆说:“你不能篡改你的数据。”

在一本数学笔记本上写一篇论文,就是同时展示你的结果和方法;发表的论文和产生它的工作。这不仅应该让读者更容易理解你做了什么,也应该让他们更容易复制(或不复制)。随着全世界数百万科学家做出增量贡献,让这些贡献加在一起产生重大意义的唯一方法是其他人能否可靠地在它们的基础上发展。“这就是以计算论文的形式呈现科学可以达到的效果,”Wolfram说。

沃尔夫勒姆说,他对计算论文没有大受欢迎感到惊讶。他记得,早在80年代初,他就与科学出版巨头爱思唯尔(Elsevier)合作。“爱思唯尔聘请我做一些关于‘科学出版的未来会是什么样子’的咨询工作。”这是在“数学笔记本”问世之前,但他还是沿着同样的思路给他们做了一次演讲。“几年前,我再次与他们的一些高层管理人员交谈。我在这次会议中意识到,天哪,35年前我说过完全一样的话!“。

我采访了西奥多·格雷(Theodore Gray),他后来离开了Wolfram Research成为一名全职作家。他说,他写笔记本的部分动机是这样一种感觉,这种感觉在20世纪90年代初就已经形成了,“很明显,所有的科学交流,所有涉及任何类型的数据、数学、建模、图表、曲线图或诸如此类的技术论文,显然都不属于纸面上。”比方说,在1990年,这是非常明显的。“他说。

他说:“在过去的29年里,这一直是一个令人困惑和惊愕的原因,除了少数人得到了它,整个社区并没有真正采用它。”“从字面上看,这是无法估量的……。损失了多少,浪费了多少时间,有多少结果被曲解或歪曲了表述。“。

2001年,费尔南多·佩雷斯(Fernando Pérez)发现自己的处境与20年前的沃尔夫勒姆(Wolfram)大致相同:他是一名年轻的物理学研究生,遇到了工具的限制。他一直在使用各种系统,数学就是其中之一,他觉得好像每项任务都需要从一个系统切换到另一个系统。他记得桌上有六七本不同的编程语言书籍。他想要的是一个统一的科学计算环境。

但他没有去开公司,而是找到了两位相距遥远的科学家,一位是德国海洋学家,另一位是加州理工大学的计算机科学研究生,他们一直在沿着同样的思路思考。他们都爱上了Python,一种开源的通用编程语言,他们都独立地开始构建工具,让它更好地为科学家工作:这些工具使管理数据集和绘制曲线图变得更容易,并鼓励了更具探索性的编程风格。

佩雷斯将这三个项目合并为一个项目,并接手了控制权。从一开始,这个名为IPython(“交互”的“i”)的项目就是开源的:这不仅仅是因为该程序是免费的,而且任何人都可以检查它的代码并对其进行修改,从而将他们的更改贡献给共同的事业。这是一个深思熟虑的决定。“我既对能够与他人分享我的作品的伦理方面感兴趣,”佩雷斯告诉我--他来自哥伦比亚,那里很难获得专有软件--“还有更多的认识论动机。”他认为,如果科学是一个开放的企业,那么用来做这件事的工具本身也应该是开放的。其源代码在法律上被禁止阅读的商业软件是“与科学观念相对立的”,而科学的目的就是打开自然的黑匣子。

因此,Python很有吸引力。与支持数学的Wolfram语言相比,Python是一种开箱即用的强大语言。但是,数学从Wolfram Research程序员大军那里获得力量的地方,Python的基本核心是由一个免费工作的开源贡献者社区构建的一个巨大的额外功能库-用于处理图像、制作音乐、构建人工智能、分析语言和绘制数据集。Python之所以成为科学计算的事实上的标准,是因为像Pérez这样的开源开发人员碰巧为它构建了有用的工具;而开源开发人员蜂拥而至,因为它恰好是科学计算的事实上的标准。编程语言社区,就像任何社交网络一样,依靠这些反馈循环的力量而兴旺或消亡。

IPython笔记本界面的想法来自于数学。佩雷斯钦佩Matharia笔记本鼓励探索性风格的方式。“你会勾勒出一些东西--因为这是你对问题进行推理的方式,也是你理解问题的方式。”他说,计算笔记本“将现场叙事的想法带了出来……。你可以思考整个过程,如果你愿意的话,你可以有效地使用计算机,作为一个计算合作伙伴,作为一个思考合作伙伴。“。

而不是构建特定的。

..