我正在努力想出一种将语音转换为文本的方法。我正在尝试使用Sphinx来实现这一目标。我的意思是非指导语言到文本是说,说话者不一定要从一组确定的句子说话。相反,他可能会说任何句子。所以我不可能有一个语法文件,其中每个单词都是语法文件中预先编写的备选方法之一。我知道我必须以某种方式训练Sphinx这样做。
但我是狮身人面像的初学者。如何开始训练Sphinx转换非制导语音?是否有可能通过Sphinx实现非制导转换?
答案 0 :(得分:0)
到目前为止,您所要完成的任务尚无法完成,至少不能令人满意。
对于基于Sphinx的解决方案:您必须创建包含要识别的所有单词的字典。没有其他办法。
一旦你有了字典,你就可以生成一个基于它的简单n-gram模型,带有ony unigrams - 每个unigram将是一个单词。每个的概率可能相同,或者您可能尝试对将要使用的单词进行一些统计分析。