测量文档准备中的“效率”：Microsoft Word与LaTex

2020-12-09 19:43:57

老板需要将项目3插入到数百个项目的编号列表中。实习生使用鼠标在屏幕上选择原始3，然后键入4，然后选择原始4，然后键入5，然后向下滚动，然后选择原来的5，然后键入6，依此类推。另一个实习生坐在看屏幕上以确保没有错误。

我碰巧是因为其他原因在房间里。我还记得观看这个野蛮编辑过程的开始的恐怖。那些可怜的实习生！

当我在计算机中输入项目列表时，我键入的内容看起来不像

每个星号都是计算机的特殊命令，告诉计算机自动为阅读器显示下一个数字。阅读器最终会看到

但这不是我键入的内容。当我插入项目，删除项目或移动项目时，这种微小的差异可以节省大量时间。

如果以后我决定跳过这些数字并改用项目符号，我告诉计算机在项目列表中插入项目符号。这是一个覆盖整个列表的命令。还有一个命令对整个文档执行相同的操作。不是每个项目的单独工作。如果共同作者想将项目符号改回数字，这没问题。

我想，实习生将手动更改＆＃34; 1。＆＃34;和＆＃34; 2。＆＃34;和＆＃34; 3。＆＃34;以此类推，以＆＃34;•＆＃34;和＆＃34;•＆＃34;和＆＃34;•＆＃34;也许他们将试图弄清楚某些搜索和替换功能如何完成相同的工作；希望文档中没有句子来谈论发生在打印机中的某些事情。 2001年。也许实习生会辞职并找到更好的工作。

[注增加了2020.12.07：我希望我的许多读者已经习惯于依靠计算机进行自动编号。但是，我很惊讶地看到一些＆＃34;不可思议！＆＃34;的注释。来自无法想象实习生如何经历如此令人震惊且效率低下的修订过程的读者。这里有一个提示：列表中的每个项目看起来像是左对齐的段落，就像本博客中的段落一样鼠标左键选中的文本，例如更改＆＃34; 3＆＃34;到＆＃34; 4＆＃34 ;，位于空白处的右边，就像每个项目中的其余文本一样。]

抽象为作者节省了时间。星号的使用只是我经常输入比最终读者看到的东西抽象得多的一个例子。我不输入＆＃34;图12＆＃34;或＆＃34;例如，请参见[41]＆＃34;我键入＆＃34; Figure \ ref {network-measurements}＆＃34;和＆＃34;参见\ cite {multiplication-survey}＆＃34 ;，然后我让计算机自动转换＆＃34; \ ref {network-measurements}＆＃34;并引用{multiplication-survey}＆＃34;以显示给读者。

使用一个额外的命令，将整个文档覆盖起来，我可以告诉计算机将节号作为文档中所有图形编号的一部分，以便使读者更容易找到图形：例如，图3.1和3.2和3.3在节中3.使用另一条命令（覆盖整个文档），我可以告诉计算机引用所有作者的姓名，而不是编号。

再举一个例子，我最近正在编辑数学论文，因此我决定，如果我更改了该概念所用的表示法，那么某个特定的概念将使读者更容易记住。只需几秒钟的编辑。我给这个概念起了个名字，曾经告诉计算机将这个名字显示为一种特殊的符号，然后在整个论文中都键入了这个名字，所以我只需要在一个地方更改符号。

当然，不能也不应该尝试为对文档的每一次可能的更改做准备。但是，为最可能的更改做准备并不难。大量的时间之后。当我说“小”时，我将尽力选择旨在简化此类操作的文档创建系统。

（作为附带说明，程序员将把这种策略视为Parnas引入的信息隐藏策略的一个示例，并且会认识到现代程序创建系统旨在简化此过程。）

Microsoft Word不会完全丢失抽象，但是这些抽象正在争夺用户界面资源，而这些功能却鼓励用户在较低的抽象层上工作。使用抽象所付出的额外努力最终促使用户做一些更简单的事情，而这些事情现在才可以使用，然后在修订文档时为此选择付出高昂的代价。

我是否做过科学研究证明Microsoft Word比LaTeX效率低？我希望看到对这个主题的仔细研究。短期而言，这将有助于指导新作者做出明智的选择。，这种研究的见解可能是进一步改善文档创建系统的基础。我当然不认为现有的系统是完美的。（示例）

但是，想像一下，一项研究只是在看某人查看打印输出时才创建与该打印输出匹配的文档，这对随后的编辑时间是盲目的，对那些实习生的痛苦却是盲目的。错误地得出结论认为键入＆＃34; 1。 ... 2. ... 3. ...＆＃34;和＆＃34;参见[41]＆＃34;比键入更有效＆＃34; * ... * ... * ...＆＃34;请参阅\ cite {multiplication-survey}＆＃34;。在此受限指标中，它的效率稍高一些，但在重要指标（即用户所花费的总时间）上，效率却低得多。

一个“科学”的例子在这一点上，您可能正在考虑没有人可能会错过这样一个明显的问题。这使我进入了本博客文章的主题，该文章是2014年经过同行评审的研究＆“文档准备系统的效率比较”。由两位心理学家Knauff和Nejasmic（＆＃34; KN＆＃34;）在学术研究与发展中使用。

研究参与者获得了一页文本，并且在有限的时间内将页面键入计算机中，共有三种不同类型的文本：

根据输入的文字数量和输入的准确程度对参与者进行评分。时间如此匆忙，以至于大部分参与者都无法完成整个页面的输入，即使是简单的散文也是如此。

这项研究考虑了两个文档创建系统：LaTeX和Microsoft Word，在每种情况下都使用所有工具，编辑器，插件和附加组件，并且参与者习惯于使用＃34 ;。当然是不同的＆＃34;附件＆＃34;效率可能有所不同，当然还有其他文档创建系统，但这是另一篇博客文章的主题。

该研究产生了许多页的结果，我将总结说Word在散文上稍好一些，在桌面上更好，而LaTeX在公式上更好。编辑步骤。

从一种度量到另一种度量。KN论文的根本错误是成本度量的变化。

最初的问题是作者创建文档的效率如何，特别是作者创建学术研究论文的效率如何.KN称其标题是比较学术中使用的文档准备系统的效率研究。但是他们随后通过三种方式悄悄地更改了该指标：

他们只考虑了文档创建过程的初始片段的效率，而忽略了修改文档所花费的时间;他们没有理由相信该片段的效率与他们先前声称要测量的东西有很好的相关性。本文承认负相关的最明显原因，即一开始的工作量稍多，使以后的修订工作变得容易得多。以我的经验，文档创建系统在支持这项工作的方式上各不相同。

KN甚至没有测量该过程的初始片段所花费的时间。相反，他们强加了紧急时间限制，并测量了所生成文档的不完整和不准确之处。同样，他们也没有提供理由相信自己测量的结果很好也许他们以为更多的错误将花费更多的时间来解决，但是我的经验是某些类型的错误比其他类型的错误更容易解决，并且文档创建系统在他们鼓励的错误类型。

KN甚至没有度量创建新文档的时间，这实际上是学者们正在花费的时间。在打字机时代写论文的人们会记得在繁琐地键入最后一页之前手写和编辑论文，但这是因为要编辑从烦人的页面（变白，有时是剪刀和胶带）到超级烦人的页面（重新整页），所以今天的初稿已被跳过，打字的内容被分成小块与作者的一部分## 39的思维过程，使打字过程变得无聊得多。我不断地重新阅读和思考我刚刚打字的内容。学术现代打字过程的错误率是否与打字的错误率相关？ KN衡量的旧式重新键入过程？再次，KN没有理由相信这一点。

KN是否使用诚实的书名，即使用也用于学术研究和开发的文档准备系统对重新输入页面进行快速重新键入的不可靠性比较？不是。您希望期刊接受这样标题的论文吗？

取而代之的是，他们使用声称没有理由的标题来衡量其他指标：＆＃34;用于学术研究和开发的文档准备系统的效率比较。因此，他们宣传指标X，即学术文档准备的效率，同时实际上，在研究度量标准Y时，急需重新键入现有页面是不可靠的。任何人简单地问“ Y比较是否会误认为X比较？”会立即提出各种答案，答案是肯定的。

伪科学，堆积如山，越来越深入。我将通过评论KN的一些引用来结束本评论：

声称这是“高度现实”的理由在哪里？要让研究人员从现有的文本页面开始，急于在计算机上键入该页面，然后不花任何时间修改文本？也许此研究的作者以这种方式制作了自己的论文，但他们没有说这，而且他们也没有从传闻证据中推断出理由。

让我提出以下假设的后续研究。与使用LaTeX的研究人员相比，使用Microsoft Word的研究人员的论文质量不仅在外观上而且在内容上都更加差劲。原因之一是使用Microsoft Word的研究人员与使用LaTeX的研究人员相比，进行修改的时间要长得多，因此系统地阻止了进行修改，从而大大改善了论文的内容。

我们的研究表明，只有在文档中包含大量数学方程式的情况下，才应将LaTeX用作文档准备系统。 ... LaTeX也常用于不包含大量数学符号和公式的文本。我们认为，在这种情况下使用LaTeX存在很大问题，研究人员应反思驱动其使用偏好的标准不需要重要数学表示形式的Microsoft Word上的LaTeX。

如果科学家声称研究人员应该反思一下他们有义务至少引用一小部分以前的文献来做到这一点吗？当然，这项研究也有各种各样的回应，而且这些回应听起来像是人们已经深思熟虑的事情。

我们的研究的一个惊人结果是，尽管降低了可用性和生产力，但LaTeX用户对他们的系统仍然非常满意。从心理学的角度来看，该发现可能与动机因素有关，即强迫或加强个人以某种方式行动以实现期望目标的驱动力。至关重要的动机因素是减少认知失调的趋势。 ...这种偏见通常是无意识的，并且随着拒绝所选替代方法的努力增加而变得越来越强烈，这在本质上类似于学习和使用LaTeX的情况。

看到（1）LaTeX用户比Microsoft Word用户更满意和（2）KN声称Microsoft Word更高效之间的对比肯定令人惊讶。：基本上，LaTeX用户在情感上无法处理他们可能会错误地使用LaTeX的想法，因此将这种想法掩盖在人为的满足感中。使用LaTeX是一种幸福药物！嘿，哥们，想给LaTeX一个试试吧，它会让您感觉很好！第一页是免费的！

一个更明显的解释是，KN选择了一个不切实际的效率指标，从而搞砸了他们的整个研究。KN在哪里都没有承认这一解释。从心理学的角度来看，KN令人惊讶的盲目性可能与动机因素有关，例如减少倾向认知失调。从事研究的作者偏向于对自己的工作感到满意，这在合理考虑他们的研究存在根本性缺陷的可能性时会干扰他们。

研究人员选择文件准备系统的第三个决定标准是对公众或行业的研究与开发成本。研究人员有责任经济有效地创造有益于社会的新技术和理论，特别是在研究是由公共资助的情况下。 ...鉴于这些数字，确定在全球范围内为研究人员在更有效的文档准备系统上使用LaTeX花费的纳税人资金数额仍然是一个悬而未决的问题，这将使他们腾出时间来推进各自的领域。

哇，我们应该根据效率来决定如何使用公共资金。这项研究错误地将不同的效率指标等同起来，并且不了解选择指标的重要性？

从我们的角度来看，实证结果比不基于此类实证结果的主张更具说服力。令人惊讶的是，一些评论员如何忽略科学决策的基本原理，即收集事实，控制变量，使用系统方法，仔细测量，将因果联系起来以及做出合理的基于证据的决策，而不是概括个人印象或观点。

肯尼迪（KN）是否对准备学术研究论文的效率进行了科学研究？不，他们没有这样做，他们实际测量的是不同的东西。度量标准的变化破坏了他们的事实，他们的＆＃34控制”，“系统方法”，“仔细测量”，“相关因果关系”以及“合理证据”他们的头衔和主要结论是，而且现在都是冒充科学的猜测。

我并不是说量化效率研究通常是一件坏事。同样，我希望看到对设计好的文档创建总成本进行适当设计的研究。但这需要认真的努力，首先要监视整个生命周期各种文档，然后了解如何在不同的文档创建系统中有效地再现这些生命周期。

这项特定研究的作者不想花那么多时间，因此他们转向了另一个更易于衡量的指标。根本的问题是，该指标与用户的实际成本关系不大。

版本：这是20201206-msword.html网页的2020.12.07版本。

https://blog.cr.yp.to/20201206-msword.html