说话人依赖语音识别与sdk

时间:2010-01-18 22:47:49

标签: speech-recognition

我想做一个小应用程序,任何人都知道一个好的说话者依赖语音识别与sdk。 (不是发短信给文本引擎)谢谢,

埃弗拉特

4 个答案:

答案 0 :(得分:1)

Sphinx可能与您正在寻找的方向相符。它是一个开源语音识别平台,也是卡内基梅隆大学正在进行的项目。

答案 1 :(得分:1)

我使用sphinx-4达到了82.25%的准确率。我正在弄清楚如何将它增加到95%以上。我正在录制一个人的声音,所以如果一个说话者依赖的系统将是有用的,将是伟大的。词汇量约为40,000字。我有一个双核心系统,我可以很容易地运行sphinx-train和sphinx4解码器,虽然培训师需要一天的时间训练我有40小时的音频并且解码器是实时的。

我想知道是否有可以使用的产品/开源库来提高我的准确率。

谢谢, 陀罗尼

答案 2 :(得分:0)

请详细说明。什么平台?什么大小的词汇量?什么性能限制?连续?半连续?你是什​​么意思“不发言到文本引擎”?

如果你需要简单和小巧的东西,你可能想尝试用C语言写的EARS而不是很大,可能对初学者有用。

答案 3 :(得分:0)

有扬声器依赖引擎,它们比较原始,就像很多手机一样。不要试图转换为文本,他们只是做信号比较。那就是我需要的。