Internet Archive Scholar:搜索数百万研究论文

2021-03-11 00:52:38

寻找研究文件,但在图书馆的目录或流行的搜索引擎中找不到副本?给互联网档案学者试试!我们可能在Web Archive中的“消失”开放式发布商中有一个PDF,这是一个来自他们存档的教师网页的发布前稿件,或旧版发布的数字化缩略量版本。

我们希望互联网档案学者将帮助研究人员和图书馆员寻找可能没有其他开放访问文件的专题。 Judith van Stegeren(@ JD7G在Twitter上)是荷兰的博士候选人,最近遇到了在电脑游戏中的程序一代研讨会纸时遇到这样的情况:“通过Mark R. Johnson展示了Mark R. Johnson,最初呈现计算创造力和amp; 2016年的游戏研讨会。该讲习班特定年份的论文在通常的书目目录中没有索引,并且托管开放访问文件的原始工作坊网站不再可访问。幸运的是,所有2016年研讨会论文的副本被捕获在Warback机器中,并通过标题或会议名称搜索IA学者来找到今天。

作为另一个例子,来自开放式血液学杂志的数十篇论文不再通过DOI解析。如前一个博客文章所述,发布者的网站消失,已被无关广告所取代。但在此之前,论文被捕获在Warback机器中,在我们的目录中索引,现在可以全额搜索:

IA学者是一个简单的访问导向的接口,用于跨多个Internet存档集合标识的内容,包括Web Archives,Archive.org文件和数字化打印材料。文章的完整文本是搜索用于针对特定短语或关键字的用户。这补充了我们现有的全文搜索索引数百万数字化书籍和archive.org的其他文档。

该服务在Fatcat上构建,我们开发了一个开放的目录,我们开发用于识别可以从长期保存,额外的元数据和永久访问中受益的风险和网络发布的开放学术出口。 FatCAT包括对图书馆员和档案师物有用的资源,例如批量元数据转储,读/写API,命令行工具和文件级档案元数据。如果您有兴趣与我们合作,或者是对文本分析应用有兴趣的研究员,我们有一个公共聊天频道,或者可以通过电子邮件发送到[email protected]

IA学者标志着我们在2018年启动的工作中的一个里程碑,以利用网络和API采伐的自动化和规模,为从公共网络保存和永久访问学术材料的空间基础设施。我们特别要感谢Mellon基金会的原始和持续支持这项工作,我们的许多当前合作伙伴以及其他合作者,贡献者和志愿者。

所有这一切都是可能的,因为令人难以置信的开放研究生态系统,由开放式访问倡导者构建和集体维护。感谢Doaj和其他团体,帮助目录开放访问辅助的期刊。感谢生物多样性遗产图书馆及其支持者,用于数字化印刷期刊文学。并感谢我们使用的许多其他组织,集成或其使用的服务,包括开放式网络指数(UNPAYWALL,CITERERX,Microsoft学术,语义学者),开放期刊目录(DOAJ,ROAN SHERPA /罗密欧,杰克,维基田)和公开书目目录(CrossRef,DataCite,J级,PubMed,DBLP)。

IA学者是由开源软件组件构建的,并且本身就是免费软件。 该网站已被慷慨的志愿者翻译成八种语言(到目前为止!)。