我想做一个小应用程序,任何人都知道一个好的说话者依赖语音识别与sdk。 (不是发短信给文本引擎)谢谢,
埃弗拉特
答案 0 :(得分:1)
Sphinx可能与您正在寻找的方向相符。它是一个开源语音识别平台,也是卡内基梅隆大学正在进行的项目。
答案 1 :(得分:1)
我使用sphinx-4达到了82.25%的准确率。我正在弄清楚如何将它增加到95%以上。我正在录制一个人的声音,所以如果一个说话者依赖的系统将是有用的,将是伟大的。词汇量约为40,000字。我有一个双核心系统,我可以很容易地运行sphinx-train和sphinx4解码器,虽然培训师需要一天的时间训练我有40小时的音频并且解码器是实时的。
我想知道是否有可以使用的产品/开源库来提高我的准确率。
谢谢, 陀罗尼
答案 2 :(得分:0)
请详细说明。什么平台?什么大小的词汇量?什么性能限制?连续?半连续?你是什么意思“不发言到文本引擎”?
如果你需要简单和小巧的东西,你可能想尝试用C语言写的EARS而不是很大,可能对初学者有用。
答案 3 :(得分:0)