Cutlet:一个用Python实现的日语到罗马字的转换器

2020-07-10 22:31:38

几个月前,我发布了Cutlet,这是一个Python库和应用程序,用于将任意日语文本转换为roMaji。

多亏了Unidic,外来词可以选择使用其原始拼写(";cutlet&34;而不是";katsu&34;)。

尤其是外文拼写功能,这是我在其他系统中从未见过的,在某些情况下,它对正确的拼写很重要。例如,瑞典山是北海道的一个社区,但即使是邮局的数据也显示,罗马吉看起来很奇特,就像瑞典的Suedenhiruzu。有了牛排,产量应该是瑞典山,如果你想要的话,可以很容易地添加一个例外。

从小牛排导入Cutletkatsu=Cutlet()katsu.roMaji(";カツカレー";)#=>;咖喱牛排(";カツカレー";)#=>;&39;小牛排-咖喱(';katsu.slug(";katsu.slug";)#=>;&39;katsu.roMaji(";katsu.roMaji;)#=>;

我制作这个库的主要动机之一是处理这样一个常见的情况:由于技术原因,使用日语文本不是一个选项,或者它是一个选项,但也有缺点。URL就是一个常见的例子--虽然您可以在URL中使用日文文本,但在许多情况下,文本变得无法读取十六进制转义,因此它实际上对任何人都没有帮助。用roMaji生成一个文章的鼻涕虫创建了一些仍然可以用日语解释的东西,并且没有任何技术兼容性方面的担忧。

Cutlet可以通过pip安装,并且可以在命令行和Python上运行。如果你能利用它,我很乐意听听。如果有一句话你想把它包括进来,请随意打开一期。虽然Idon没有计划更多的主要功能,但我想做一个网络版本,你可以用它来试用;如果我安装好了,我会在Twitter上发布这一点的。Ψ