TTS:全部的文字致辞

2021-04-15 22:29:35

TTS是一个高级文本到语音生成的库。它建立了最新研究的&#39,旨在实现易于训练,速度和优质的最佳权衡.TTS附带普里尔覆盖的型号,用于测量数据集质量的工具,已用20多种语言使用产品和研究项目。

请使用我们的专用频道进行问题和讨论。如果它公开分享,那么帮助更有价值,以便更多的人可以从中受益。

您还可以帮助我们实现更多型号。这里可以在此处找到一些相关的工作。

如果您只对释放TTS模型合成语音,请从PYPI安装是最简单的选择。

| - 笔记本/(Jupyter笔记本电脑用于模型评估,参数选择和数据分析。)| - Utils /(常用实用程序。)| - tts | - bin /(所有可执行文件的文件夹。)| - 火车* .py(火车您的目标模型。)| - 分发。使用多个GPUS(使用多个GPU训练您的TTS模型。)| - compute_statistics.py(计算规范化的数据集统计信息。)| - 转换* .py(将目标火炬模型转换为tf。)| - TTS /(文本到语音模型)| - 图层/(模型层定义)| - 型号/(型号定义)| - TF /(TensorFlow 2实用程序和型号实现)| - Utils /(型号特定实用程序)| - Speaker_Encoder /(扬声器编码器型号。)| - (相同)| - Vocoder /(Vocoder型号)| - (相同)

在下面,您可以在16K迭代后看到TacoTron模型状态,其中批量大小32带Ljspeech DataSet。

"哈佛大学最近的研究表明,只需8周就冥想,实际上可以增加大脑中的灰质,负责情绪调节和学习。"

TTS为您的自定义数据集提供了一种易于使用的通用数据加载器。您只需编写一个简单的函数来格式化数据集。检查数据集/ preprocess.py以查看一些示例。在此之后,您需要在config.json中设置数据集字段。

安装后,TTS提供用于使用预先训练的模型来合成语音的CLI接口。您可以使用您自己的模型或TTS项目下的发布模型。

从发布的模型列表中运行TTS和声码器模型。 (只需将列表中的完整模型名称复制并粘贴到下面的命令的参数。)

tts --text" tts&#34的文本; \ --model_path路径/ to / config.json \ --config_path路径/ to / model.pth.tar \ --out_path输出/ path / demogin.wav \ --vocoder_path路径/ to / ocoder.pth.tar \ - -vocoder_config_path路径/ to / ocoder_config.json

注意:如果您愿意从TTS项目文件夹运行TTS,则可以使用./tts/bin/synthesize.py。

在这里,您可以找到一个COLAB笔记本电脑,培训LJSPeech。或者您可以手动遵循下面的指南。

首先,分别将Metadata.csv拆分为列车和验证子集分别metadata_train.csv和metadata_val.csv。请注意,对于文本到语音,验证性能可能会误导,因为损耗值不会直接测量人耳的语音质量,它也不会测量注意力模块性能。因此,用新的句子运行模型并倾听结果是最好的方法。

要培训新模型,您需要定义自己的config.json以定义模型详细信息,训练素配置等(检查示例)。然后调用电切列车脚本。

例如,为了在LJSheech数据集上培训Tacotron或Tacotron2模型,请按照下列步骤操作。

每次运行都会创建一个新的输出文件夹,适用于使用的config.json,模型检查点和tensorboard日志。

如果出现任何错误或截取的执行情况,如果在输出文件夹下没有检查点,则将删除整个文件夹。

此存储库由Mozilla' S的行为准则和礼仪指南管辖。有关详细信息,请阅读Mozilla社区参与指南。

在使用我们的沟通渠道,您可以随时随地平地。

如果您想使用TTS尝试新的想法并喜欢与社区分享您的实验,我们敦促您使用以下指南以获得更好的协作。(如果您有一个更好的合作,请告诉我们)