我想为美国本土语言(wayuunaiki)创建一个TTS系统。 该语言是用拉丁语(西方)字母表编写的。 我还有关于语音的信息(将每个单词转换为IPA符号的规则)。
我计划创建一个来自本地人的录音数据库。然后我想以某种方式训练这些数据,使用IPA等效信息生成更准确的语音模型。
我对自然语言处理完全陌生,所以我的问题是......我可以使用哪些工具来执行我的计划?
我听说HTK和CMU Sphinx在语音识别方面相当不错。不知道语音生成。也听说过节日,但我读它只使用预定义的最知名的语言:英语,西班牙语等。
请原谅我的打字错误。我还在学习英语。提前谢谢!
答案 0 :(得分:4)
您可以在Festival中添加新语言,它实际上是专为简化新语言创建而设计的。有关详细信息,请阅读festvox书籍:
要考虑的另一个工具包是OpenMary,请参阅他们的文档
https://github.com/marytts/marytts/wiki/New-Language-Support
它更现代,可能对您更容易。
无论如何,您将不得不花一些时间编写代码来描述您的语言。通常它有大约300行代码。之后,您可以录制单扬声器TTS数据库并运行语音构建过程。记录的越多,结果就越好。
答案 1 :(得分:0)
使用Festival工具包进行文本到语音转换(提示:使用Linux操作系统)