Wayback Machine和Cloudflare联手归档更多Web内容

2020-09-19 03:21:29

互联网档案馆和Cloudflare已经联手对使用Cloudflare的Always Online服务的网站的内容进行存档,这增加了用户在停机期间能够查看网站最新版本的可能性。这一合作关系将增加互联网档案馆扫描的网页数量,使该组织的回退机对一般互联网用户更有用。

启用Cloudflare的Always Online服务的网站现在将自动将其内容存档,如果Cloudflare碰巧无法访问原始主机,那么互联网档案馆将介入,以确保用户能够访问这些页面,互联网档案馆退回机主任马克·格雷厄姆(Mark Graham)在一份声明中表示。

CloudFlare首席执行官马修·普林斯表示,其Always Online功能可以保存缓存网站的有限副本,以便在原始服务器不可用时为访问者保持在线,从而确保显示最受欢迎的网站。CloudFlare首席执行官马修·普林斯表示,使用WaybackMachine将改善Always Online服务。

普林斯说,互联网档案馆的Wayback Machine有一个令人印象深刻的基础设施,可以大规模地对网络进行归档。

这一合作关系将反过来提高Wayback Machine存档网络的能力。格雷厄姆写道,非营利的互联网档案馆(Internet Archive)的系统不能抓取整个网络,但已经提供了超过4680亿个存档网页,并且每天新增超过10亿个存档URL。格雷厄姆解释说,它通过各种不同的方法做到这一点,比如从数百万个网站的列表中爬行,这些网站由用户通过Wayback Machine Now&39;Save Page功能提交,[网站]添加到维基百科文章中,在Tweet中引用,并基于许多其他信号和来源,如新闻故事的多个订阅源。

CloudFlare的Always Online服务现在是Wayback Machine查找和存档网站的另一个途径。格雷厄姆写道,当新的URL被添加到使用该服务的网站时,它们将被提交给WaybackMachine存档。在某些情况下,这将是我们的系统第一次看到URL并导致第一次存档事件。在所有情况下,使用回路机的任何人都可以使用这些新存档的URL。";

格雷厄姆预测,这一合作关系将让互联网档案馆在备份更多公共网络方面做得更好,这样做有助于使网络变得更有用和更可靠。

在服务器脱机时访问网站的存档版本的用户将只能看到静态页面。Cloudflare在一个描述集成工作原理的新支持页面中表示,与网站动态部分(如购物车或评论框)交互的访问者将看到一个由离线原始Web服务器导致的错误页面。当某个网站无法访问时,Cloudflare表示,它会首先检查Cloudflare的缓存中是否有过时或过期的网站版本。如果没有,Cloudflare会去互联网档案馆取回你网站的静态部分并提供服务。";

Cloudflare的免费用户可以使用Internet Archive集成,但只会每30天备份一次网站。CloudFlare的付费客户将获得更频繁的备份,专业版用户每15天备份一次,商业和企业用户每5天备份一次。

选择要为其启用与Internet存档集成始终在线的域。此时将显示CloudFlare控制面板。

要启用Always Online,请滚动至Always Online Beta卡并将其切换为ON。