应用错误收集

说话人依赖语音识别与sdk

时间：2010-01-18 22:47:49

标签： speech-recognition

我想做一个小应用程序，任何人都知道一个好的说话者依赖语音识别与sdk。（不是发短信给文本引擎）谢谢，

埃弗拉特

4 个答案:

答案 0 :(得分：1)

Sphinx可能与您正在寻找的方向相符。它是一个开源语音识别平台，也是卡内基梅隆大学正在进行的项目。

答案 1 :(得分：1)

我使用sphinx-4达到了82.25％的准确率。我正在弄清楚如何将它增加到95％以上。我正在录制一个人的声音，所以如果一个说话者依赖的系统将是有用的，将是伟大的。词汇量约为40,000字。我有一个双核心系统，我可以很容易地运行sphinx-train和sphinx4解码器，虽然培训师需要一天的时间训练我有40小时的音频并且解码器是实时的。

我想知道是否有可以使用的产品/开源库来提高我的准确率。

谢谢，陀罗尼

答案 2 :(得分：0)

请详细说明。什么平台？什么大小的词汇量？什么性能限制？连续？半连续？你是什么意思“不发言到文本引擎”？

如果你需要简单和小巧的东西，你可能想尝试用C语言写的EARS而不是很大，可能对初学者有用。

答案 3 :(得分：0)

有扬声器依赖引擎，它们比较原始，就像很多手机一样。不要试图转换为文本，他们只是做信号比较。那就是我需要的。