我正在考虑为我的母语开发语音识别软件,我正在考虑使用CMUSphinx-4。有一个CMU字典文件,其中包含英文单词,这些英文单词将原始单词的分割映射到其音素边界。例如, ABANDONED => ['AH','B','AE','N','D','AH','N','D'] 我无法理解这背后的逻辑,我想为这个单词对话开发一个算法。如果有人知道这种转换的算法或者这种分裂是如何发生的,请与我分享。
答案 0 :(得分:1)
原始单词到其音素边界
"边界"这里说错了。它将单词映射到音素序列,没有关于边界
如果有人知道这种转换的算法或这种分裂的发生方式,请与我分享。
我们的教程
中介绍了字典构造