我们是否更接近蒂姆·伯纳斯·李(Tim Berners Lee)关于信息管理的最初愿景?

2020-07-24 02:38:00

将1989年3月编写的原始MacWord(或Word for Mac?)文档手动转换为HTML,之后重新分发,与1990年5月添加的日期不同。仅供历史研究之用。这些图表有点斑驳,但在下面链接的版本中可以找到。文本未更改,即使是为了更正错误,如数字编号错误或参考文献未完成。

这份文件试图说服欧洲核子研究中心管理层,全球超文本系统符合欧洲核子研究中心的利益。请注意,这一次我对ITAT唯一的名字是";Mesh&34;--我在1990年编写代码时决定使用万维网(World Wide Web)。

Tim Berners-Lee,CERN 1989年3月,1990年5月本提案涉及CERN加速器和实验的一般信息管理。讨论了复杂演化系统的信息丢失问题,提出了一种基于分布式超文本系统的解决方案。

欧洲核子研究中心和大型强子对撞机时代关于未来的许多讨论都以这样一个问题结束--是的,但是我们将如何跟踪这么大的项目呢?这项提案为这些问题提供了答案。首先,讨论了欧洲核子研究中心的信息获取问题。然后,介绍了链接信息系统的概念,并将它们与较不灵活的信息查找方式进行了比较。

然后总结了我用非线性文本系统了解超文本的短暂经验,描述了CERN需要从这样的系统中得到什么,以及行业可以提供什么。最后,它建议了我们现在应该采取的步骤,让我们自己参与到超文本中来,这样我们就可以单独地和集体地理解我们正在创造的东西。

欧洲核子研究组织是一个很棒的组织。它涉及数千人,其中许多人非常有创造力,所有人都为了共同的目标而工作。虽然名义上它们被组织成一个分层的管理结构,但这并不限制人们的沟通方式,以及跨群体共享信息、设备和软件的方式。

实际观察到的该组织的工作结构是一个多连接的网络,其互连关系随着时间的推移而发展。在这种环境下,新来的人或承担新任务的人通常会得到一些提示,告诉他们谁会是有用的交谈对象。关于有哪些设施以及如何找到它们的信息在走廊八卦和偶尔的时事通讯中传播,关于需要做什么的细节也以类似的方式传播。综合考虑,尽管偶尔会有误会和重复努力,但结果还是非常成功的。

然而,一个问题是人员的高流动率。当两年是非典型的逗留时间时,信息就会不断丢失。介绍新人需要他们和其他人花相当多的时间,然后他们才会知道发生了什么。过去项目的技术细节有时会永远丢失,或者只有在紧急情况下进行侦察调查后才能找回。通常,这些信息已经被记录下来了,只是找不到而已。

如果欧洲核子研究中心的实验是一个静态的、只有一次的发展,那么所有的信息都可以写在一本大书里。事实上,CERN随着新思想的产生、新技术的出现以及为了绕过不可预见的技术问题而不断变化。当需要改变时,通常只影响组织的一小部分。更换部分实验或探测器有局部原因。在这一点上,人们不得不四处挖掘,看看还有哪些地方和人会受到影响。使一本书与时俱进是不切实际的,而且书的结构需要不断修改。

在欧洲核子研究中心,信息丢失的问题可能特别严重,但在这个案例中(就像在某些其他案例中一样),欧洲核子研究中心在几年后将成为世界其他地区的缩影。欧洲核子研究中心现在遇到了一些世界其他国家不久将不得不面对的问题。10年后,上述问题可能会有很多商业化的解决方案,而今天我们需要一些东西来让我们继续下去。

在提供一个处理这类信息的系统时,人们希望能够开发出一个信息池,这个信息池可以随着组织及其描述的项目而增长和发展。要做到这一点,存储方法不能对信息施加自己的限制。这就是为什么在笔记之间有链接(如参考)的笔记网络要比固定的层次结构系统有用得多。在描述复杂系统时,许多人使用圆圈和箭头的图表。圆圈和箭头让人可以自由地描述事物之间的相互关系,而表格就是不能这样做的。我们需要的系统就像一个圆圈和箭头的图表,圆圈和箭头可以代表任何东西。

我们可以将圆称为节点,将箭头称为链接。假设每个节点都像一个小笔记、摘要文章或评论。我在此并不太担心它是有文字还是有图形,或者两者都有。理想情况下,它代表秩序描述一个特定的人或物体。节点的示例可以是。

这些圆圈和箭头、节点和链接在各种常规图表中具有不同的意义:

系统必须允许输入任何类型的信息。另一个人必须能够找到信息,有时不知道他在寻找什么。

在实践中,系统了解项之间链接的一般类型(例如,依赖项)和节点类型(人、物、文档)是很有用的。不加任何限制。

许多系统是按等级组织的。CERNDOC文档系统就是一个例子,Unix文件系统和VMS/Help系统也是如此。树的实际优势是为每个节点提供唯一的名称。然而,它不允许系统对真实世界进行建模。例如,在诸如VMS/HELP之类的分层HELP系统中,人们通常会到达树上的一片叶子,例如

并且有必要离开系统并重新进入系统。需要的是从一个节点到另一个节点的链接,因为在这种情况下,信息没有自然地组织成树。

树结构系统的另一个例子是uucp新闻系统(在Unix下试试)。这是一个层次化的讨论系统(新闻组),每个讨论组包含由许多人贡献的文章。这是一种非常有用的汇集专业知识的方法,但它的缺点是缺乏灵活性,通常情况下,一个新闻组下的讨论会发展成另一个不同的话题,在这一点上,它应该在树的不同部分。(参见图1)。

来自mcvax!uunet!pyrdc!pyrnj!rutgers!bellcore!geppetto!duncan清华3月...备选方案第93条。超文本:路径:cernvax!mcvax!uunet!pyrdc!pyrnj!rutgers!bellcore!geppetto!duncan>;From:[email protected](斯科特·邓肯)新闻组:备选方案超文本主题:RE:对免费信息网络的威胁邮件-ID:<;[email protected]>;日期:10-Mar 89 21:00:44格林尼治标准时间:<;[email protected][email protected]...发件人:[email protected][email protected](Scott Duncan)组织:计算机技术转移,BellcoreLines:18Doug Thompson写了一篇我认为是一篇关于审查制度的深思熟虑的文章--然而,我对其观点的接受或拒绝与这篇帖子并不是特别相关。作为回答,Greg Lee有点简明扼要地反对。我的问题是。不知何故,超文本似乎不是合适的地方,人们会不会觉得转向另类个人主义,甚至是某个社会团体是合适的呢?我不太关心对rec.humor.有趣的具体审查问题,而是Greg';文章中提出的观点。当然,仅就我自己而言,我是斯科特·P·邓肯([email protected]或...!Bellcore!CTT!Duncan)(Bellcore,444 Hoes Lane RRC 1H-210,Piscataway,NJ…)(201-699-3910(W)201-463)(Bellcore,444 Hoes Lane RRC 1H-210,Piscataway,NJ.)(201-699-3910(W)201-463。

图1.UUCP新闻计划中的一篇文章。主题字段允许在新闻组中将同一主题的备注链接在一起。新闻组的名称(alt.Hypertext)是分层名称。此特别说明表示方案的严格树结构存在问题:此讨论涉及多个方面。请注意,";References";、";From";和";Subject";字段均可用于生成链接。

关键字是访问没有确切坐标的数据的常用方法。然而,关键字通常存在的问题是,两个人从不选择相同的关键字。然后关键字变得有用,只有已经很了解应用程序的人才有用。

实用的关键字系统(例如VAX/Notes)需要注册关键字。这已经是朝着正确方向迈出的一步。链接的系统将这带到下一个逻辑步骤。关键字可以是代表概念的节点。因此,关键字节点与任何其他节点没有什么不同,可以将文档等链接到关键字。然后,可以通过查找与关键字相关的任何节点来查找关键字。通过这种方式,关于相似主题的文件通过它们的关键概念间接地联系在一起。然后,关键字搜索变成从少量命名节点开始的搜索,并找到与所有节点接近的节点。

正是出于这些原因,我首先制作了一个小的链接信息系统,没有意识到已经为这个想法创造了一个术语:超文本。

1980年,我编写了一个程序来跟踪我参与PS控制系统的软件。它被称为“询问”(Ququire),允许人们存储信息片段,并以任何方式将相关片段链接在一起。为了找到信息,一个人通过从一张纸到另一张纸的链接前进,就像在古老的电脑游戏冒险中一样。我将其用于人员和模块的个人记录。它类似于苹果最近为Macintosh生产的Hypercard应用程序。不同之处在于,尽管Ququire缺乏华丽的图形,但它运行在一个多用户系统上,并允许许多人访问相同的数据。

RPC项目文档(概念)大多数文档都可以在VMS上找到,两本主要手册存储在CERNDOC系统中。1)包括:VAX/NOTES会议VXCERN::RPC 2)包括:测试和示例套件3)包括:RPC错误列表4)包括:RPC系统:实施指南维护、移植等信息5)包括:建议的RPC应用程序开发策略6)包括:";关于RPC的说明,1,2月8日7)包括:";关于建议的RPC开发的说明";关于建议的RPC开发的说明";18,2月86 8)包括:RPC用户手册。9)包括:规范草案和实施说明10)包括:RPC帮助工具11)描述:DD/OC帮助显示中的远程过程调用项目选择返回退出标记GOTO_MARK链接添加编辑。

图2.查询方案中的一个屏幕。这个示例基本上是一个列表,所以链接列表比节点本身上的文本更重要。请注意,每个链接都有一个类型(例如";Includes";Includes";(底线是菜单栏。)。

在我回到欧洲核子研究中心DD部门后不久,我发现环境与PS部门相似,我错过了询问。因此,我为VMS制作了一个版本,并使用它来跟踪我工作过的项目、人员、团队、实验、软件模块和硬件设备。我个人觉得它非常有用。我没有努力使它适合一般的消费,但我发现有几个人成功地用它浏览了项目,并自发地找到了各种各样的东西。

与此同时,已经制作了几个项目来探索这些想法,无论是商业上的还是学术上的。他们中的大多数人在文档、图标或突出显示的短语中使用热点作为敏感区域。用鼠标触摸热点将调出相关信息,或扩展屏幕上的文本以包含该热点。想象一下,本文档中的引用都与它们所引用的事物的网络地址相关联,这样在阅读本文档时,您只需单击鼠标就可以跳到它们。

超文本(Hypertext)是泰德·纳尔逊(Ted Nelson)在20世纪50年代创造的一个术语,虽然它被用来包含两种不同之处,但在这些系统中已经变得流行起来。一个想法(与这个问题相关)是这样一个概念:超文本:以一种不受约束的方式链接在一起的人类可读信息。

另一种想法是独立的,主要是技术和时间的问题,是关于包括图形、语音和视频在内的多媒体文档的,我在这里不再进一步讨论后一方面,尽管我将使用超级媒体这个词来表明一个人不受文本的约束。

很难评估大型超媒体系统对组织的影响,通常是因为这些系统从未真正大规模使用过。因此,我们需要大量的现有信息,以便使用任何新的信息管理系统都可以访问。

要成为CERN环境下的实用系统,有许多明确的实用要求。

需要从不同类型的系统(VM/CMS、Macintosh、VAX/VMS、Unix)访问相同的数据。

信息系统从小规模起步并不断发展壮大。它们开始时也是孤立的,然后合并。一个新的系统必须允许现有的系统连接在一起,而不需要任何中央控制或协调。

如果我们提供对现有数据库的访问,就好像它们是在超文本形式中一样,系统将更快地启动。下面将进一步讨论这一点。

一个人必须能够添加自己的私人链接到公共信息和从公共信息。用户还必须能够私下注释链接和节点。

在短期内,存储ASCII文本并在24x80屏幕上显示是足够的,也是必要的。添加图形将是一个可选的额外功能,目前渗透率要低得多。

考虑到一个带有类型链接的大型超文本数据库,一个耐人寻味的可能性是,它允许一定程度的自动分析。例如,可以搜索诸如无文档记录的软件或不包含人员的部门之类的异常情况。可以为其他目的生成人员或设备的列表,例如通知更改的人员的邮件列表。也可以查看组织或项目的拓扑结构,并得出关于它应该如何管理以及如何发展的结论。当数据库变得非常大时,这尤其有用,例如,当项目组相互交织在一起,以至于很难看到树木的情况下,这就特别有用。

在欧洲核子研究中心这样复杂的地方,如何将人分成几组并不总是显而易见的。想象一下,制作一个巨大的三维模型,人们由小球体呈现,在工作中有共同之处的人之间有线。

现在想象一下,拿起结构,摇晃它,直到你感觉到一些纠结:也许,你会在一些地方看到紧密联系的团体,在一些地方,交流的薄弱领域只有几个人。也许一个相互联系的信息系统会让我们看到我们工作的组织的真实结构。

链接(或热点)引用的数据可能是非常静态的,也可能是临时的。在欧洲核子研究中心的许多情况下,有关系统状态的信息一直在变化。超文本允许将文档链接到实时数据中,以便每次单击链接时都会检索信息。如果一个人牺牲了可移植性,那么就有可能使跟随链接启动一个特殊的应用程序,这样,例如,诊断程序就可以直接链接到维护指南中。

关于超文本的讨论有时会涉及版权保护和数据安全问题。在欧洲核子研究中心,这些都是次要的,在那里信息交换仍然比保密更重要。可以想象,超文本的授权和记账系统可以设计得非常复杂,但这里没有提出。

在必须参考实际受保护的数据的情况下,现有的文件保护系统应该就足够了。

以下是提议的系统将立即有用的三个具体地方的例子。还有很多其他的。

Remote Procedure Call项目有一个使用Enquire的框架描述,虽然有限,但它对于记录谁做了什么、他们在哪里、存在哪些文档等非常有用。此外,人们可以跟踪用户,并且可以很容易地添加手头上没有其他地方可以放置的任何额外的少量信息。与其他项目以及包含人员和文件信息的数据库的交叉链接将非常有用,并可避免信息重复。

CERNDOC系统提供存储和打印文档的机制。链接系统将允许人们浏览概念、文档、系统和作者,还允许存储文档之间的引用。(一旦找到文档,就可以调用现有的机器来打印或显示它)。

个人技能和经验正是需要超文本灵活性的那类东西。人们可以链接到他们参与的项目,而这些项目又可以链接到特定的机器、编程语言等。

越来越多的工作在大学和商业研究实验室进行超媒体研究,并产生了一些商业系统。有两个会议,超文本87和88,并在华盛顿特区,国家标准和技术研究所(NST)主办超文本标准化研讨会,其后续行动将在1990年举行。

ACM关于超文本的通讯特刊包含了许多超文本论文的参考文献。[NIST90]中给出了关于超文本的参考书目,并提供了一个uucp新闻组备选方案。超文本存在。因此,我在这里没有给出一个清单。

很多学术研究都是针对在复杂的信息空间中浏览的人机界面方面的。解决的问题是让导航变得容易,避免给人一种迷失在超空间中的感觉。虽然研究结果很有趣,但CERN的许多用户将使用原始终端访问系统,因此高级窗口样式对我们来说已经不那么重要了。

目前可用的大多数系统都使用单个数据库。这可由许多用户通过使用分布式文件系统来访问。很少有产品能够通过允许不同数据库中的节点之间的链接来实现泰德·纳尔逊的宽文档概念。为了做到这一点,有必要采取一些措施。然而,在标准化研讨会上,重点放在了可交换媒体Norfor Networking格式的标准化上。这是由于对发布超媒体信息的强烈推动,例如在光盘上。对于超文本系统应该使用的抽象数据模型,似乎有一个普遍的共识。

不幸的是,许多系统在组装时很少或根本没有考虑到可移植性。其他一些虽然发布了,但都是专有软件,不允许外部发布。然而,有几个有趣的项目,而且更多的项目一直在出现。例如,Digital';s&34;CompoundDocument Architecture(CDA)就是一种可以扩展为超媒体模型的数据模型,有传言称这是Digital想要走的一条路。

美国国防部大力鼓励超媒体研究。

.