应用错误收集

时间：2014-03-26 14:11:01

标签： nlp text-to-speech cmusphinx festival htk

我想为美国本土语言（wayuunaiki）创建一个TTS系统。该语言是用拉丁语（西方）字母表编写的。我还有关于语音的信息（将每个单词转换为IPA符号的规则）。

我计划创建一个来自本地人的录音数据库。然后我想以某种方式训练这些数据，使用IPA等效信息生成更准确的语音模型。

我对自然语言处理完全陌生，所以我的问题是......我可以使用哪些工具来执行我的计划？

我听说HTK和CMU Sphinx在语音识别方面相当不错。不知道语音生成。也听说过节日，但我读它只使用预定义的最知名的语言：英语，西班牙语等。

请原谅我的打字错误。我还在学习英语。提前谢谢！

答案 0 :(得分：4)

您可以在Festival中添加新语言，它实际上是专为简化新语言创建而设计的。有关详细信息，请阅读festvox书籍：

要考虑的另一个工具包是OpenMary，请参阅他们的文档

它更现代，可能对您更容易。

无论如何，您将不得不花一些时间编写代码来描述您的语言。通常它有大约300行代码。之后，您可以录制单扬声器TTS数据库并运行语音构建过程。记录的越多，结果就越好。

答案 1 :(得分：0)

使用Festival工具包进行文本到语音转换（提示：使用Linux操作系统）