保留闪存:为什么仿真比迁移更好

2020-11-26 03:09:06

杰夫·罗滕伯格(Jeff Rothenberg)1995年的开创性著作《确保数字文档的寿命》着眼于编码文档格式过时的威胁,并使其内容不可访问。这是可以理解的,这是过去几十年的普遍经验。 Rothenberg描述了解决此问题的两种不同方法,即将文档的内容从注定的格式迁移到注定较少的格式,并模拟在当前环境中访问文档的软件。自1995年以来,Web就一直主导着数字内容,并且在Web世界中,格式(如果有的话)已经过时了,因为它们实际上是网络协议,因此已经过时了。 IPv6的示例显示了发展网络协议的难度。但是现在,随着长期努力消灭Adobe Flash的努力取得了成果,Web格式已经过时了,它已经被广泛使用。幸运的是,Internet存档中Jason Scott的Flash Animations Forever Live永远表明我们一直都是对的。在折叠之下,我进入细节。受Rothenberg文章启发的保护主义者认为,迁移是唯一可行的方法,这可能是因为仿真技术面临更大的挑战。他们构建了通过抢先迁移内容到他们认为不太可能成为过时的一小套格式中的一种来吸收内容的系统。这种“侵略性”方法存在许多问题,我在本博客的第三篇文章《格式过时:前列腺癌的保存》中提出了一些问题,例如:许多数字保存系统定义了保存级别;分配给格式的级别越高,系统提供的保存的“保证”就越强。例如,PDF的级别高于Microsoft Word。从本质上讲,迁移格式的难度越大,保存该格式的工作就越少。但是格式越容易迁移,风险就越低。因此,投资,特别是在“积极”方法上的投资,集中在低下的成果上。这既不存在重大的丢失风险,也不存在格式过时的重大风险。

至少可以说,有可能评估格式将来会遇到的厄运程度的想法令人怀疑。从1998年LOCKSS计划开始之初,我们就不同意“激进”的方法,认为最重要的是收集和保留原始位,并弄清楚如何在需要时提供访问权限。我们的论点充耳不闻,因此在2005年,我们实施并演示了一种技术,通过该技术,访问时格式迁移对用户完全透明(请参阅保留的Web内容的透明格式迁移)。这样就可以将关于较小保留格式的决定推迟到答案明确为止。但是这种方法的基础是一个假设,即实际上存在着某种较小的格式,可以将注定的格式迁移到其中而不会遭受灾难性的信息丢失。在Adobe Flash的情况下,即使过时了,也没有人发现这种格式。迁移方法仅在2016年Adobe Animate可以将其转换为HTML5(仅在2014年指定)时才适用于Flash,这是一种昂贵且脆弱的迁移。 Flash内容在Rothenberg的意义上不像一个“文档”,而更像一个程序。幸运的是,正如我在2015年的报告《作为保存策略的仿真和虚拟化:仿真框架》中的最新发展中所描述的那样,仿真框架的最新发展使得可以通过使Web呈现为网页的常规组件的方式向读者提供仿真。这消除了将仿真部署为保留策略的主要障碍。

此类框架中最重要的也许是Internet存档的Emularity,它将仿真器注入阅读器的浏览器中以处理保留的内容。现在,杰森·斯科特(Jason Scott)写道:利用开发中的名为Ruffle的Flash模拟器,我们向Internet Archive的Emularity系统添加了Flash支持,使一部分Flash项目可以在浏览器中播放,就像您安装了Flash插件一样。尽管Ruffle与Flash的兼容性不足100%,但它将以流畅且准确的速度在浏览器中播放历史Flash动画的很大一部分。我们展示了该系列中精选的最佳或代表性Flash产品。如果您想尽最大努力梳理到目前为止已上传的1,000多个Flash项目,请点击以下链接。您将不需要安装Flash插件,并且该系统可以在所有支持Webassembly的浏览器中运行。

现在可以访问保留的Flash内容这一事实非常重要,尤其是对于Web的历史而言。正如Scott所写:从大约2000年到2005年,Flash是一代创意艺术家,动画师和小型工作室的头等大事。网上有成千上万的个人作品。 Flash也可以用于制作引人入胜的网页菜单和导航系统,并且Web上的许多主要和次要播放器都使用Flash为其用户带来了另一层体验。 ...这段时间是Flash的高峰期。几乎每个浏览器都可以使用“ Flash插件”来使它起作用,成千上万的人正在尝试使用Flash制作艺术和娱乐节目,成千上万的观众(尤其是年轻人)都期待每个新版本。

不幸的是,由于基于迁移的保存策略而导致的优先级放错了位置,这意味着正式的保存系统大多无法保存Flash内容,因此可能丢失了很多东西。但是,所有致力于使人们能够在Web开发中经历这一重要时期的人都感到荣幸。