使用`make‘和`git Difference`实现简单而强大的测试工具

2020-05-22 15:12:28

首先，是一个演示。以下是仅使用6行Makefile[(取决于您如何计算它。)]实现的结果：

⚠️这里应该有一个终端录制播放器，但是看起来JavaScript还在加载，或者您已经阻止了第一方JavaScript。如果要在不使用JavaScript的情况下播放录音，可以在任何支持ttyrec格式的软件中播放。我使用Termrec，下面将使用它来播放：

让我们直接跳到一个示例Makefile，通常使用文件名Makefile：

r通配符=$(foreach d，$(通配符$1*)，$(调用r通配符，$d/，$2)$(筛选器$2，$d))。PHONY：测试测试：$(patsubst%.test，%.stdout，$(调用r通配符，%.test))%.stdout：%.test./$<；>；$@2>；$(patsubst%.stdout，%.。false)git diff--退出代码--src-prefix=预期/--dst-prefix=Actual/\$@$(patsubst%.stdout，%.stderr，$@)\||(touch--date=@0$@；false)。

如果你熟悉makefile，这可能足以让你理解整篇文章，你就可以停止阅读了。这篇文章的其余部分解释了如何使用它，它是如何工作的，以及该方法的局限性。

请注意，这都是针对GNU make的。其他make实现可能不支持所有foreach、通配符、调用、过滤器和patsubst函数，因此您可能需要以另一种方式写出测试目标的先决条件。然而，总体原则是合理的。

创建一个可执行文件[也就是说，在Unixy平台上，它需要使用mode+x，并且要么是可执行二进制文件，要么以Shebang开头。]。名为foo.test，它包含要测试的脚本。

运行make test(测试运行似乎会成功，因为预期的输出还没有添加到Git中[Git中的大多数内容忽略未跟踪的文件；Git Diff…。stderr不输出任何内容，并在未跟踪这两个文件时报告成功。])。

检查刚刚创建的foo.stdout和foo.stderr的内容，确保它们符合您的预期。

这与Git没有本质上的联系；您可以将git diff调用替换为来自另一个版本控制系统的语义等价的调用。

正如您希望看到的，这很简单，只有六行。然而，它的功能非常强大：通过使用make，您可以免费获得各种美好的魔法。

如果测试在其他输入(例如，测试数据或构建构件)上有所不同，您只需向目标添加新的前提条件：

如果你愿意，你可以对前提条件有更多的了解。这些功能允许您只运行输入(无论是数据还是代码)已更改的测试，而不是所有测试。

如果您始终希望运行所有测试(如果您尚未设置精确的依赖项跟踪，则可能希望这样做)，请标记所有%.stdout目标假(将在下面解释)：

如果您只想运行所有测试一次，那么运行make--ways-make test[--ways-make的缩写是-B，但我建议在大多数地方使用长选项。]。

如果您想并发运行测试，可以使用make--Jobs=8test[缩写形式-j8，这是我确实使用缩写形式的测试。]。或者类似的。(注意：与--KEEP-GOGING结合使用，可能会将来自多个Diffs的行交错输出到终端。)

默认情况下，它将在第一次测试失败时退出，但是--继续[缩写-k。]。将继续运行所有测试，直到尽其所能地完成为止。(如果您知道所做的更改将更改许多测试的输出，因此它将同时更新它们的所有stdout和stderr文件，则这几乎是必要的。)。

让我们一点一点地将这六行分开，看看它是如何工作的。

此r通配符函数是递归通配符匹配器。$(通配符)执行单一级别的匹配；这会使其达到多个级别。

我不打算解释它是如何工作的所有细节，但以下是它实现的算法的近似值，用伪代码表示：

函数r通配符(目录，模式)：对于每个项目，作为目录中的路径：如果路径是目录：发出所有r通配符(路径，模式)，否则(路径是文件)：如果路径匹配模式：发出路径。

我使用$(调用r通配符，%.test)而不是$(Shell Find)。-name\*.test)主要是为了兼容性，因此不需要查找二进制文件(GNU findutils或其他变体)。

PHONY：test规则将test标记为假目标，这在大多数情况下不是必需的，但是会稍微加快速度，并确保在创建名为“test”的文件时测试不会中断。如果您将单个测试标记为虚假，结果是它不会检查文件修改时间，而只会始终重新运行测试。

然后是针对实际测试目标的规则。它没有配方，这意味着当您运行make test时，在它运行所有必要的测试之后，不会发生任何额外的事情：它只是各个部分的总和，没有更多。

它的部件？它依赖于$(patsubst%.test，%.stdout，$(调用r通配符，%.test))，这意味着“递归查找所有*.test文件($(调用r通配符，%.test))，然后将每个文件的‘.test’扩展名更改为‘.stdout’($(patsubst%.test，%.stdout，…))”。

您可能想知道为什么它需要依赖于foo.stdout而不是foo.test：这是因为foo.stdout是将运行测试的目标，而依赖于foo.test只能确保测试的存在。

您可能想知道为什么我们搜索foo.test定义文件并将其扩展名更改为.stdout，而不仅仅是搜索.stdout文件：这样我们就可以创建新的测试，而不需要手动创建.stdout文件。

这样做的结果是，我们创建了一个名为“test”的假目标，它取决于所有测试的结果。说它运行所有测试是不正确的；测试目标并不运行测试，而是声明“我要求在运行我之前运行测试”[请考虑如何恰当地将这些事情命名为先决条件而不是依赖项。]。(正如所讨论的，运行测试目标本身不会做任何事情，因为它没有配方)。每次运行所有测试的方法是将它们全部标记为false；否则，make将查看它们的先决条件树，并可能观察到它们已经满足要求，其中stdout文件比测试文件更新，因此会说“该测试已经运行，不需要再次运行”。

%.stdout：%.test./$<；>；$@2>；$(patsubst%.stdout，%.stderr，$@)\||(touch--date=@0$@；false)git diff--exit-code--src-prefix=Expect/-dst-prefix=Actual/\$@$(patsubst%.stdout，%.stderr，$@)\||(。

我们使用隐式规则，这样就不需要枚举所有文件(我们可以通过几种方式做到这一点，但这会更痛苦)。

此规则规定“通过运行这两个命令，可以基于具有相同基本名称(但扩展名为‘.test’)的文件创建扩展名为‘.stdout’的任何文件”。

$<；扩展为第一个先决条件的名称，在本例中为foo.test。

(行尾的反斜杠是行续行符，这一点也很重要。配方的每一行都是单独调用的。[您可以使用.ONESHELL：选择退出此行为，但这是在GNU to make 3.82中引入的，而且MacOS出于许可原因包括了古老的GNU to make 3.81，所以在使用它之前要考虑兼容性。])。

./foo.test>；foo.stdout 2>；foo.stderr\||(touch--date=@0 foo.stdout；false)git diff--exit-code--src-prefix=预期/--dst-prefix=Actual/\foo.stdout foo.stderr\||(touch--date=@0 foo.stdout；false)。

如果失败：zerfoo.stdout的mtime[即，将文件的“上次修改”时间更新为Unix纪元1970-01-01T00：00：00Z。]。因此它比foo.test旧(因此，make的后续调用不会认为foo.stdout目标是满足的；您也可以删除该文件，但这样做用处较小)，然后失败(这将导致make停止执行配方，并报告失败)。

运行git diff，打印对这些文件的任何未暂存的更改(即：测试输出与预期不符的任何方式)。

如果对这些文件有任何未暂存的更改，则将foo.stdout的mtime清零(原因与前面相同)并报告失败。

如前所述，假设每次运行命令的输出都是相同的，我们只是在做一个天真的差异。

在实践中，通常会有一些细微的变化区域，例如时间戳或持续时间数字。

例如，如果您有生成带有？t=时间戳或？的URL的东西。散列缓存破坏，您可能希望将时间戳置零或将散列转换为常量值。如果您的测试文件是shell脚本，则清理输出可能如下所示：

这种通用的方法允许您丢弃随机性来源，甚至量化它(例如，丢弃毫秒，但保留秒)，但是很难做任何更花哨的事情，比如通过数字比较来检查某个值是否在给定的误差范围内-如果您不小心，就会开始编写一个测试框架，而不是使用git diff作为测试框架。[如果您真的想在这里走得更远，那就开始考虑如何应用Git筛选器属性。但我建议不要这样做，即使这是可能的！]。

在当前的语言和环境中，正确声明依赖项通常是不可行的，因此您最终可能需要过于宽泛的先决条件，如“此测试依赖于所有源文件”，因此可能会运行比实际需要更多的测试。

在各地启动流程可能会很昂贵。解释器通常需要数百毫秒才能启动，更不用说需要多长时间来导入代码了，您现在每次测试都需要做一次，而不是整个测试一次。

对输出进行过滤以使其具有确定性，从而有效地限制您进行相等性检查，而不是比较。在很大程度上，这是一个测试框架，只有断言，几乎没有逻辑。

Git不以任何方式管理文件修改时间。一旦你提交了本质上是构建工件的东西，这可能会成为一件麻烦事，因为make是根据mtime做出决定的。只要正确指定了所有的依赖项，应该不会造成任何破坏[在一般情况下，这实际上并不完全正确；几个月前我在工作中遇到过一个案例，我在那里临时向存储库添加了一个构建构件，它通常工作得很好，但只是偶尔mtime会出现在前面，构建服务器会尝试重新构建它并失败，因为它的网络访问被锁定了，但是构建那个特定的构件需要访问Internet。]。如果您不使用Git修改stdout文件，但这可能会导致不必要的测试运行。当你想稳妥行事时，Make--Always-Make测试将是你的朋友。

当您在提供测试工具的生态系统中时，您可能应该使用它；但是在这样的生态系统之外，shell脚本、生成文件和版本控制的功能确实可以很好地工作，以最小的努力产生良好的结果。

这种方法有各种限制，但对于许多事情来说，它工作得非常好，并且可以扩展很多。我特别喜欢它跟踪预期输出的方式，使手动检查变得简单，更新变得微不足道。

我以前使用过类似的方法，我发现makefile在大大小小的各种事情上通常都非常有效；我认为这种技术展示了make的一些巧妙功能。

GNU make文档相当不错。有时很难在索引中找到您要查找的内容，但信息肯定都在那里。

评论？问题？改过自新？如果你想就这篇文章中的任何事情与我联系，请发电子邮件给我，邮箱是[email protected]。

https://chrismorgan.info/blog/make-and-git-diff-test-harness/

2020-5-12 21:42

2020-5-12 13:35

2020-5-6 19:20

2020-5-2 17:47