基于最小费用流的神经解码:从UGARIC到线性B

2020-10-22 08:49:20

下载PDF摘要:在本文中,我们提出了一种新的神经网络方法来自动破译丢失的语言。为了弥补强监督信号的不足,我们的模型设计参考了历史语言学记载的语言变化模式。该模型利用一种富有表现力的序列到序列模型来捕捉同源词之间的字符级对应关系。为了以无监督的方式有效地训练模型,我们创新了训练过程,将其形式化为最小费用流问题。将其应用于乌加里亚语的译码,获得了5.5%的绝对改进,超过了最先进的结果。我们还报告了第一个自动破译线性B的结果,线性B是一种与古希腊语相关的音节语言,我们的模型正确翻译了67.3%的同源词。

ArxivLabs是一个框架,允许合作者直接在我们的网站上开发和共享新的arxiv功能。

与arxivLabs合作的个人和组织都接受并接受了我们开放、社区、卓越和用户数据隐私的价值观。Arxiv致力于这些价值观,只与坚持这些价值观的合作伙伴合作。

你有一个为arxiv&39;社区增加价值的项目的想法吗?了解有关arxivLabs的更多信息以及如何参与其中。

书目工具代码推荐器