空格，语言

2020-10-14 00:29:54

“空白”是相当多人听说过的一种深奥的编程语言。我敢肯定，这和它的源代码打印出来时效率惊人的笑话一点关系都没有。语言实际上是一个笑话(至少当其中一位作者在他的一些演讲中提到这种语言时，他是这么说的)，这一点我相信是没有任何关系的，比如它的源代码在打印出来时效率如此之高。实际上，它的本意是一个笑话(至少当它的一位作者在他的一些演讲中提到这种语言时是这样说的)。但是，即使人们意识到了这种语言的存在，他们也很少知道它是如何运作的。让我们改变这一点，因为这真的不是那么难。

该语言的核心是描述堆栈机器上的操作，该机器可以访问堆。机器的唯一数据类型是任意大小的整数值。机器也有一些操作，它们也使用这些值对字符进行编码。仅此而已。其余部分只是使用三个ASCII空格字符(TAB、SPACE和LINEFEED)对操作和值进行编码的一种特殊方式。

操作按功能分组。这些组确定语言规范称为“指令修改参数”的操作sencoding前缀。许多操作没有参数，因为它们在机器的堆栈上创建和使用参数。然而，有些确实带有参数：整数和标签。流控制操作使用标签参数；一些堆栈操作使用整数参数。

它们的编码相似：都使用由空格和制表符组成的字符串，以换行符结束。在标签中，空格和制表符没有特殊的语义。至少不在语言规范中；稍后会详细介绍。在整数中，制表符编码1，空格编码0。关于这样的整数文字需要注意的是，它们不使用两个补码来编码负数。取而代之的是，他们使用文字最左边的位作为符号位：制表符表示负数，空格表示正数。这使得对任意宽的整数进行直接编码。

当您查看实际的空格程序时，您有时会注意到非常长的标签。通常情况下，似乎有一种默默的惯例，即使用8个字符的块来编码8位(在数字文字中，哪些字符编码1和0与数字相同)，这些位被转换成一个正数，然后映射到ASCII编码(7个本来就足够了，但这不是我的程序所看到的)。

当您尝试并实现这种语言时，您会注意到您的机器实现需要一些东西：显然是一个堆栈，因为空格是一种错误操作的语言。另一个堆栈，用作调用堆栈，因为该语言有调用和返回操作。它还需要一个堆，将地址映射到整数。最后，您将需要程序内存和程序计数器。您可能还需要一个跳转表，以处理标签到地址的转换。不过，这并不是严格要求：在将程序加载到您的机器之前，您只需将所有标签转换为地址即可。

当我深入研究语言规范来弄清楚这一点时，我非常感兴趣，实际上做了另一个语言的实现。它的名字叫Space Man，可以在gitlab.com/ft/space eman和github.com/ft/space eman上找到。

我已经添加了原始语言主页的组织模式转换，因为该转换目前只能通过Archive.org获得。在尝试一些你可以在网上找到的更复杂的例子时，我遇到了一些问题。我的实现甚至无法解析它们。我验证了我的代码很长一段时间，直到我得出结论认为它正确地实现了解析器。所以我研究了其他实现。事实证明，它们中的大多数都实现了两个额外的堆栈操作：Copy和Slide，显然，它们被添加到该语言的后来的规范中。不过，我在网上找不到这样的规格(并不是说我花了很多时间)。然而，在实现了这两个之后，太空人可以运行我可以在网上找到的最精细的例子，比如数独解算器。我已经在包含的语言版本中添加了这两个额外的操作。

我正在使用兆秒进行解析。有了普京提供的几个实用程序，编写解析器变得相当轻松：

StackParser：：parser StackOperationstackParser=do(try$imp[space])(try$PUSH<；$>；number[space])<；|>；(try$operation[linefeed，space]Duplicate)<；|>；(try$operation[linefeed，table]exchange)<；|>；(try$operation[linefeed，linefeed]drop)<；|>；(try$copy<；$>；Number[表格，空格])<；|>；(尝试$Slide<；$>；number[表格，换行符])。

在实现该语言的操作时，您会发现您面对的是许多操纵虚拟机的通用指令。当然，你把这些常见的任务放入函数中，就像任何称职的汇编语言设计者一样，你显然给你的指令起了有点隐晦的三个字母的名字。有了这些，实现堆栈操作操作如下所示：

评估：：空白计算机->；堆栈操作->；IO空白Machineeval m(Push N)=return$pci$psh[n]meval m Duplicate=return$pci$psh h m其中h=peek 1 meval m exchange=return$pci$psh[b，a]$drp 2 m其中[a，b]=peek 2 meval drop=return$pci$drp 1 meval m(Copy I)=return$pci$psh[n]m其中n=ref I meval m(幻灯片n)=return$pci$psh$DRP(n+1)m其中h=peek 1 m。

实现其他操作组看起来类似。我有点喜欢。每个都可以放在头顶的滑梯上。

事实证明，编辑空格程序是一项艰巨的工作。直接操作最好是在十六进制编辑器中完成。但是太空人有一个特性，那就是将程序语法树转储到标准输出。这些程序转储实际上是可执行的程序。因此，如果你想编辑一个空格程序，你可以把它压缩成一个文件，编辑它的AST，然后运行该程序来产生变化后的空格程序。

http://bewatermyfriend.org/p/2020/000/

tags users