用数据记录喝酒

2022-02-26 04:08:01

$head facts/Recipes马提尼<；-伦敦干吉尼马提尼<；-干苦艾酒轻拉姆代基里<；-酸橙汁白兰地<；-简单糖浆玛格丽塔<；-布兰科龙舌兰或雷帕萨多龙舌兰<；-酸橙汁玛格利塔<；-橙汁玛格丽塔<；-石灰楔。。。

天哪，不多。我可以在吧台上添加什么来扩展我的选择？

$cat结果/购物清单伦敦干杜松子酒->；吉姆莱特伦敦杜松子酒->；martinichampagne->；airmailcognac->；在床单之间Hery->；雪莉柯布勒胡姆阿格里科尔->；钛冲压机

不，你错了，这很聪明。仔细看一看Daiquiri：菜谱上要求加酸橙汁，但我们的酒吧里没有酸橙汁。我们只有酸橙。那么为什么它会显示为可混合的呢？

我很高兴你这么问。这些结果是由我编写的一个名为Mixologician的小型数据记录程序生成的。

调酒师知道一些规则。它知道酸橙可以制成酸橙汁——酸橙楔、酸橙皮等等。它甚至知道酸橙皮加糖可以制成酸橙热饮——所以它知道，我们离制作小金环只有一种原料，尽管从技术上讲，我们没有一种饮料需要的单一原料。

我喜欢鸡尾酒。从前，我喜欢去餐馆点鸡尾酒。但由于某种原因，我有一段时间没去餐馆了，而是在家里做鸡尾酒。

但我不想每次都混合同样的鸡尾酒。我喜欢这家餐厅的鸡尾酒点餐体验的很大一部分是多样性：我经常光顾的每一家时髦餐厅都有自己的鸡尾酒菜单——它有自己独特的一套饮料，里面有我从未听说过的配料。

看，我没有一个非常全面的酒类收藏。我有基本的，当然，在隔离的过程中，我获得了一些更高级的成分。但花式配料通常不是万能的：我曾经买过一瓶Amaro Nono来混合纸飞机。但事实证明我不喜欢真正的纸飞机。所以现在我只喝了97.1%的阿玛罗诺诺，与此无关。1.

所以我写了一个小程序来告诉我：考虑到我现在在酒吧里拥有的东西，我应该添加什么才能让我最大限度地制作新鸡尾酒。或者换句话说，我最有效的购买方式是什么——我最“受阻”的成分是什么

我想这将是一个尝试Datalog的好机会，我以前听过Datalog这个词。

现在，你可能会认为这听起来像是一个小问题，你可以编写几行Python，根据你拥有的和你需要的进行集减法运算，然后过滤掉只缺少一种成分的鸡尾酒。

逻辑编程对我来说似乎合适的原因是这些“生产规则”的想法：可以成为（或结合成为）其他成分的成分。

现在，我并不是说用你最喜欢的脚本语言来建模会很困难，但如果不使用猜测和检查之类的暴力搜索，如何实现这一点已经不太明显了。并不是说这有什么问题；它感觉更适合逻辑编程。

或者不是！谁知道呢。我对逻辑编程一无所知。这整件事只是一个尝试的借口。

与所有代码一样，该代码也在GitHub上。你可以浏览一下这个项目——我建议从测试开始，因为它们提供了一种关于它如何工作的知识指南。

但我敢说，代码本身并没有那么有趣：如果你已经知道数据日志，那么它就微不足道了；如果你不这样做，这是难以理解的。

因此，我将一件一件地浏览最终结果，并讨论我在这一过程中犯下的一些错误。由于这是我第一次接触Datalog，我花了一段时间才能够“思考”Datalog希望我的方式——我认为我在这一过程中犯的错误比最终结果有趣得多。

自定义类型使代码的其余部分更具可读性，并让编译器捕捉到愚蠢的错误，比如混淆关系的顺序。

symbol就是Datalog所说的“字符串”——我指出这一点是因为如果你习惯于LISP、Ruby或其他一些使用不同术语的语言，可能会有点困惑。

我在思考关系时遇到了很多困难，直到我有了一个事后看来非常明显的见解：我实际上一直在关系数据库中使用关系。因此，把Has想象成SQL中的一个表，只包含一列，可能会很有用。这不完全是一回事，但我发现这是思考如何“塑造”我的数据的一个不错的起点。

那个输入行只是从文本文件中加载一个成分列表——每行一种成分。如果愿意，可以在我们的表中插入行——除了在数据日志中，“行”称为“事实”

这种关系更有趣：这些是我们的食谱。虽然在传统语言中，我们可能会认为食谱是{name:string，components:List<；string>；}，我们必须在某种程度上改变事物，以适应关系的“表格式”表示。

同样，我们只是从纯文本文件加载数据。默认情况下，Souffle希望读取以制表符分隔的值，但我制作了一个自定义分隔符，因为我认为它的读取效果更好，所以我不必处理制表符。没人想处理标签。

.decl产生（输入：成分，输出：成分）。输入Begets（文件名="；Begets"；，分隔符="；->；"；）。输入开始（文件名="；自动开始"；，分隔符="；->；"；）

Begets是一段我们以后会经常谈论的关系。现在，只要把它想象成一堆像“酸橙生酸橙汁”或“干邑生白兰地”这样的说法——这些成分可以成为其他成分，或者可以作为其他成分。“生儿育女”这个名字很奇怪，有点笨拙；一旦我们看到它的使用方式，我会解释为什么我会选择它而不是make或actsa之类的东西。

我从两个独立的文件加载Begets，因为一个是手工制作的，另一个是自动生成的——我将在稍后讨论食谱时解释为什么会这样。

这些是我们的“多种成分”基本上，想想调味糖浆——看看文件中的一些例子：

我只费心支持两种成分组合，因为这基本上涵盖了所有东西。但是，如果你愿意，你可以添加另一个Composite3（）关系或其他东西来支持更多成分。

等等，如果复合材料不能，为什么食谱中可以任意添加许多成分？为什么不在这里做同样的事情，只是做一个“表”的成分组合？

好的，问得好。基本上，我认为这会给这个例子增加一个分散注意力的复杂程度，所以我把它留给读者作为练习。实际上我还没有尝试过，但我认为它会起作用，你甚至可以把“食谱”的概念概括为任何“一种或多种事物的组合”，只有一种类型，所有东西都会很漂亮、优雅，但在博客文章中很难理解。

我不会从文件中加载这个。相反，我基本上是说，“如果x出现在需求关系的第一列，那么它就是一个配方。”您可以将其视为类似于SQL视图，有点像：

我把IsRecipe作为一个助手，因为我认为它比我所说的“所有食谱”更明确

.decl-isingredent（x：成分）isingredent（x）：-Needs（ux）。IsingCredit（x）：-Begets（x，u）。IsIngredient（x）：-产生（ux）。IsingElement（x）：-Composite（x，，）。IsingElement（x）：-Composite（x，x，x）。IsingElement（x）：-Composite（，，x）。

这是另一个助手，但它有多个规则。所有这些都是某种“联合”在一起的。基本上：“x是一种成分，如果它被用在配方中，或者出现在贝格茨规则或复合描述中。”

我们可以在某个地方列出一个文件中的所有成分，但我认为在意向上声明这种关系要好得多。我还想炫耀一下，这是我有生以来第一次正确使用这个词。2.

下一个关系非常简单：Unbuyable是一个类似蛋清的列表，它作为配料出现，但我不想出现在最终输出中，因为我实际上无法在商店购买蛋清。像Begets一样，我也有一些自动生成和手工策划的作品。

第一条规则基本上是说“所有成分都会产生它们自己。”我希望能够写出Begets（x，x）。，但Datalog不允许这种“无限”规则——它需要我为x提供一个域，这就是我们的iSingCredit助手的作用。

这就是为什么这种关系被称为“生儿育女”，而不是“制造”或“生产”之类的东西。最初它被称为Makes，我有一些尴尬的表达方式，比如“如果你有x或者你有y使得（y，x）那么&；mldr”，通过让一切都开始，我能够极大地简化“购物清单”的计算。

第二条规则只是说Begets是传递性的：如果酸橙皮产生酸橙皮，酸橙皮产生酸橙皮，那么酸橙皮产生酸橙皮。实际上，我并没有费心在这样的粒度级别编写规则，但如果我愿意，我可以。

基本上，如果你有一个输入（例如柠檬），而输入产生了其他东西（例如柠檬汁），那么你也有“输出”但是不能使用“输出”这个词，因为它是保留的，如果您尝试以下操作，会收到令人困惑的错误消息：

错误：语法错误，意外的关系限定符输出，预期）在文件MixLogician中。第32行的dl Has（输出）：-Has（输入），Begets（输入，输出）----^---------------------------------------1生成错误，评估中止

您可能还记得，我们最初从一个文件中加载了Has，它只是Datalog称之为“事实”的一个简单列表但现在我们正在动态地向它添加事实——我们一开始认为它是一个表，但现在它是一种奇怪的表/视图混合的东西。因此，SQL类比有点崩溃。

是的，考虑到生（x，x）这个事实可能会有点困惑，所以我们在这里做一种自我引用的无限陈述：“如果你有x，那么你有x，因为x生x。”但数据日志并不介意。

Begets（x，result）：-Composite（result，first，second）、Has（first）、Begets（x，second）。Begets（x，result）：-Composite（result，first，second）、Has（second）、Begets（x，first）。

在这里，我们说“复合成分”中的一种成分产生了该复合成分，但前提是你已经有了另一种成分。

这是我们掌握的第一条复杂规则，所以我将从更简单的例子中学习。这是我第一次尝试：

也就是说，“如果你有糖，酸橙皮生酸橙皮，如果你有酸橙皮，糖生酸橙皮。”

这实际上非常有效——但是，你知道，我们不想用代码来写。我们想从文件中加载这些事实，所以我们引入了复合关系：

这只是我们上次写的东西的重述，但现在它适用于我们复合关系中的任何东西。

但这种逻辑有一个微妙的问题。也就是说：酸橙的热情会产生酸橙的热情，但酸橙不会。而且我通常不会自己储存石灰皮，所以根据这个逻辑，即使我有石灰，我也不能使石灰热乎乎的。

所以这就是我们有点间接的原因：只要你还有糖，任何能产生酸橙热情的东西也能产生酸橙热饮。让我们看看“具体”形式的工作规则，没有复合关系：

贝吉斯（x，"；莱姆热诚"；）：有（"；糖"；），生菜（x，"；酸橙皮"；）。贝吉斯（x，"；莱姆热诚"；）：有（"；酸橙皮"；），生出（x，"；糖"；）。

我认为这更容易阅读，你可以想象在这里应用相同的复合替换来获得上面的“完整”规则。

贝吉斯（x，"；莱姆热诚"；）：有（y），生（y，"；糖"；），生菜（x，"；酸橙皮"；）。贝吉斯（x，"；莱姆热诚"；）：有（y），生（y，"；酸橙皮"；），生出（x，"；糖"；）。

我之所以提到这一点，是因为在我意识到这是不必要的之前，我实际上先写了这篇文章：因为有一条规则：Has（out）：-Has（in），beggets（in，out）。，我们通过Has（"；石灰皮"；）来报道这个案例一点3.

这是一个非常琐碎的帮手关系——如果一种饮料需要某种成分，而我们没有这种成分，那么它就缺少了这种成分。这是我们第一个关系否定的例子，这是一个有趣的短语。

我们用它来声明我们能够混合的所有饮料——也就是说，所有不含任何缺失成分的饮料。

但Souffle否认了这一点：我们需要限制这种关系的范围。您可能会认为这是在尝试创建一个SQL表，其中包含另一个SQL表中不存在的所有值，这会很快耗尽磁盘空间。或者，如果你是蛋奶酥，我猜你的记忆力会耗尽？

我认为这为数据日志的本质提供了一个有趣的洞察：尽管我们编写规则就像我们在声明函数一样，但最终我认为所有关系都需要能够实现为一大堆元组。引擎可能能够优化实际实现，但它需要成为可能。我想。就像我说的，我对数据日志一无所知。

这种关系非常简单，我第一次尝试使用Mixologician来制作饮料时就添加了这种关系。它不仅仅是一个名字列表，而是我的食谱，过滤到我可以制作的食谱中——这样我就可以搜索特定的成分，如果我想做一些特别的东西的话。

但最后一条规则是最美味的。因此，我们来到这里的原因是：

.decl启用（缺少：配料、饮料：配方）启用（配料、饮料）：-！不可购买的（配料），缺少的（饮料，产品），缺少的（饮料，产品），计数：{Missing（饮料，）}=count:{Begets（配料，产品），缺少的（饮料，产品）}。。输出可混合（文件名="；可混合"；）。输出可混合配方（文件名="；可混合配方"；，分隔符="；<；-"；）。输出启用（文件名="；购物清单"；，分隔符="；->；"；）

我会花很多时间来讨论这条规则，所以我想得到答案。先把输出线让开。当我编写这个程序时，我也会经常抛出其他关系，作为调试东西的一种方式。它非常有用。

启用（配料、饮料）：-！不可购买（配料）、缺失（饮料、产品）、缺失（饮料、产品）、计数：{Missing（饮料、产品）}=count:{Begets（配料、产品）、缺失（饮料、产品）}。

这个Unbuyable（配料）条款很琐碎——它的存在只是为了过滤掉我们不想在产品中看到的东西，比如酸橙皮。让我们暂时忽略这一点：

启用（成分，饮料）：-Missing（饮料，out），Begets（成分，out），count:{Missing（饮料，）}=count:{Begets（成分，产品），Missing（饮料，产品）}。

在英语中：“如果饮料缺少某种成分可以产生的东西，如果饮料中唯一缺少的成分可以由成分产生，那么成分可以让你制作饮料。”

不，但这就是它的意思。它真的说，“如果饮料中缺少某种成分可以产生的东西，如果饮料中缺少的成分的数量等于饮料中缺少的成分的数量，那么成分可以让你制作饮料。”我们实际上是在比较集合的基数，而不是集合的相等性，但是由于一个集合是另一个集合的子集，所以它们可以具有相同基数的唯一方法是如果集合是相同的。4如果可以的话，我们会比较set equality，但据我所知，Souffle不能这么做。

希望这是有道理的。说到底，这是一个非常简单的表达。但我花了好几个小时才写完。真正地我想我花了好几个小时想出了一条规则。这是非常有趣和有教育意义的，但我觉得当你直接跳到最后的答案时，这段旅程的很多好处都消失了。

当然，但我想后退几步，谈谈我是如何来到这里的。我希望你和我一起踏上一段旅程，以那句话结束。但会从非常不同的事情开始。

看，当我第一次开始时，我没有在数据日志中思考。我在用“逻辑”思考我想写这样的东西：

我想说“给我看看我目前没有的成分，但是如果我有了它们，我就可以混合一种新的饮料。”这是我花了很长时间试图翻译成数据日志的逻辑表达式，但这是不可能的——没有“假设”运算符。也许我可以在序言中写些类似的东西？如前所述，我对逻辑编程一无所知。

所以不管怎样，我很快意识到，在数据日志中表达这一点是不可能的。所以我试着做一些简单的事情：只需找到缺少一种成分的食谱。忘记所有关于生儿育女或合成物的事；我们稍后再加进去。现在，你怎么才能找到“几乎”可以混合的食谱呢？

这是我在翻译标准一阶逻辑“唯一性”表达式时极其笨拙的尝试：

基本上我想说的是“饮料缺少了成分，它没有遗漏任何其他东西。”但这不起作用：我仍然在用“逻辑”思考，而不是用数据日志。

最终，在阅读文档时，我看到了计数的总和，并能够写下这句话——我的第一个表达实际上告诉了我一些有趣的事情：

错误：见证问题：聚合器以参数为基础'；在file mixologician中，s的内部作用域在外部作用域中不接地使用。第53AlmostMixable（drink）行的dl:-count:{Missing（drink，）}=1--------------^--------------------------------------------1生成错误，评估中止

我发现我需要第一个缺失的（饮料）来“磨碎”变量——你明白了。当使用SQL聚合表达式时，会遇到相同类型的错误——引用在同一级别“不存在”的变量。我真的不知道该用什么词来清楚地谈论这件事。

总之，我一到那里，就想看看缺少的配料。但这是一个简单的改变——别再忽视这个变量了：

太棒了！这确实告诉我哪些饮料缺少一种成分。

但现在我们需要担心那些“制造”其他成分的成分。在这一点上，我所拥有的只是一个看起来像这样的关系：

基本上，我还没有Begets（x，x）规则——但我们会做到的。

启用（成分，饮料）：-Missing（饮料，成分），count:{Missing（饮料，饮料）}=1。启用（in，drink）：-make（in，missing），Enables（missing，drink）。

但这第二条规则并不能满足所有要求：它基本上是说“如果一种饮料缺少一种成分，那么获得任何制造这种成分的东西也可以让你制作这种饮料。”

这适用于一些简单的事情，比如“酸橙给你酸橙汁，现在你可以做玛格丽塔了。”但是，如果一种饮料缺少多种成分，而所有这些成分都可以通过获取一种新成分来制作，那该怎么办？这在Gimlet的实践中出现：假设你有杜松子酒和糖，但你缺少了莱姆汁和莱姆酒。你只需要买酸橙，但是这个小玩意儿缺少两种成分，所以它不会出现。

启用（成分，饮料）：-Missing（饮料，成分），count:{Missing（饮料，饮料）}=1。启用（成分，饮料）：-Missing（饮料，out），make（成分，out），count:{Missing（饮料，）}=count:{make（成分，产品），Missing（饮料，产品）}。

有一段时间我觉得这很管用。看起来是这样的

......

https://ianthehenry.com/posts/drinking-with-datalog/

Jeanne Calment（最长寿的有记录的人）实际上是两个人吗？

2021-7-27 6:11

382天水快

2021-6-24 23:18

包围西部的记录温度不是你的平均热波

2021-6-23 8:26

西方的极端热量可能会破坏200条记录，并生产最多127°的临时时间

2021-6-16 10:10

tags users