用于为自定义语言设计TTS(文本到语音)系统的工具包?

时间:2014-03-26 14:11:01

标签: nlp text-to-speech cmusphinx festival htk

我想为美国本土语言(wayuunaiki)创建一个TTS系统。 该语言是用拉丁语(西方)字母表编写的。 我还有关于语音的信息(将每个单词转换为IPA符号的规则)。

我计划创建一个来自本地人的录音数据库。然后我想以某种方式训练这些数据,使用IPA等效信息生成更准确的语音模型。

我对自然语言处理完全陌生,所以我的问题是......我可以使用哪些工具来执行我的计划?

我听说HTK和CMU Sphinx在语音识别方面相当不错。不知道语音生成。也听说过节日,但我读它只使用预定义的最知名的语言:英语,西班牙语等。

请原谅我的打字错误。我还在学习英语。提前谢谢!

2 个答案:

答案 0 :(得分:4)

您可以在Festival中添加新语言,它实际上是专为简化新语言创建而设计的。有关详细信息,请阅读festvox书籍:

http://festvox.org/bsv/

要考虑的另一个工具包是OpenMary,请参阅他们的文档

https://github.com/marytts/marytts/wiki/New-Language-Support

它更现代,可能对您更容易。

无论如何,您将不得不花一些时间编写代码来描述您的语言。通常它有大约300行代码。之后,您可以录制单扬声器TTS数据库并运行语音构建过程。记录的越多,结果就越好。

答案 1 :(得分:0)

使用Festival工具包进行文本到语音转换(提示:使用Linux操作系统)