我开发了一个应用程序,使用SAPI 5.1
将语音转换为文本。
由于准确性太弱,我决定创建自己的语法,我创建了自己的grammmar,只识别1到10的数字。
我的准确性再次失败。所以我深入研究了语法文件。我浏览了用于发音的Lexion文件。所以我的问题是
将lexicon文件改进 准确性?这样我就可以用了 数字1到10的发音 在Lexicon文件中然后 使用它。
我需要一个关于如何的模板 创建词典文件。
答案 0 :(得分:0)
如果您的语音识别准确度较低,则可能是以下任何一种原因:
没有足够的训练数据 - 请注意,创建一个与扬声器相关的语音识别系统(仅与一个扬声器相连)需要每个单词的大量单位(在您的情况下为1到10)。培训初始模型需要单独的单元,然后可能需要嵌入式培训数据以进一步改进模型。
与说话者无关的语音识别模型将需要更多数据。
测试和培训数据之间存在不匹配。如果使用无噪声数据或带有重音的数据创建模型,则在使用具有大量噪声或具有不同重音的数据进行测试时可能难以获得良好的结果。
但是有关您正在尝试构建的语音识别系统的更多细节会更好。
更新1:由于您在评论中提到您使用的是Microsoft Speech SDK,因此以下是training the speech SDK on sounds/accents的指南。只需按照说明进行操作即可。