时空笔迹模仿

2020-06-12 09:24:04

据我们所知,这是第一篇通过模仿真实的时间书写过程来合成逼真的西方草书笔迹的论文。我们的方法几乎是全自动的,例如,不需要手动剪切字符,并且能够呈现完整的行,而不是像其他作品中的字形/单词。

发送手写的个人问候语,而不是将其写在纸上并扫描。

生成笔迹训练现代文本识别引擎,通常需要大量的训练样本。

使法医研究人员能够在不需要人的情况下生成和模仿笔迹。因此,创建更健壮的写入者识别方法。

在目前的阶段,这一代的作品相当健壮,但在人工制品、缺少标点符号和合成书法糟糕的作家方面存在问题。

对一般写作风格的模仿效果很好,钢笔模仿也是如此。然而,笔画的模仿仍然是有限的(这主要可以归功于我们在这一部分使用的A.Graves的方法,下面的S.)。因此,大多数人和特别是。法医专家会注意到与原件的不同之处。

目前,该系统必须用大约30行要模拟的主题进行训练。

作者:马丁·迈尔,马丁·斯顿夫,安圭洛斯·尼古拉,马蒂亚斯·塞雷特,安德烈亚斯·迈尔,文森特·克里斯莱恩预印本:https://arxiv.org/abs/2003.10593 Code:https://github.com/M4rt1nM4yr/spatio-temporal_handwriting_imitation

从一个离线序列,我们创建一个时间序列,用于修改笔划样式(顶部路径)。最后,我们将其传输回与图像样式相适应的离线域,即笔型、颜色(底部路径)。

首先,我们需要创建一个健壮的骨架。为了能够用在线数据训练系统,我们开发了一种迭代知识转移,它可以被视为一个展开的CycleGAN。这避免了允许笔划修改的循环一致性。它使用简单的映射来生成脱机手写到手写骨架的更一般的映射。我们表明,这比经典的骨架化更稳健。

第二步是生成笔画序列。我们无法通过不断的重采样来训练系统,因此我们提出了“最大加速度重采样”,即以稀疏的方式对直线上的点进行采样。

这里,我们使用了Alex Graves的开创性工作“用递归神经网络生成序列”(Generating Sequence With Recurn Neurn Network)https://arxiv.org/abs/1308.0850。

对于图像/笔样式转换,我们修改了众所周知的Pix2pix框架以合并样式信息。

我们创建了一项用户研究,该研究在线位于https://forms.gle/MGCPk5UkxnR23FqT9下方。我们希望鼓励每个人仍然参与进来,这样我们就可以获得更多的数据来进行统计。

主要结果:1.在图灵测试中,人们仅以50.3%的比例(67.7%的真实样本为真实样本)将我们的假冒样本归为真实样本。2.一种作者识别系统,将25%的伪造段落指定为由要模仿的人所写。