应用错误收集

如何从语音转录中构建语言模型？

时间：2015-09-18 04:25:32

标签： speech-recognition cmusphinx pocketsphinx language-model

我使用来自维基百科转储的数据构建了语言泰米尔语言模型，使用工具CMUCLMTK。现在，如何生成动态转录并在模型中替换它们。维基文章（http://cmusphinx.sourceforge.net/wiki/phonemerecognition）说替换转录而不是单词。我现在应该做什么？

1 个答案:

答案 0 :(得分：1)

您可以编写一个python脚本来用其音素替换字符。英语中大约有44个音素，你可以简单地创建一个字典，将一个字符映射到它的音素。要将您的转录转换为音素，只需将每个单词分解为字符，然后通过匹配字典中的字符替换其音素。您可以使用术语频率或tf-idf

使这更有趣