应用错误收集

培训语音识别软件

时间：2010-05-08 02:45:32

标签： speech-recognition

一个小小的左侧领域，但我正在尝试训练一个语音识别程序，指南建议我尝试清楚但自然地说话。然而，我注意到，当一个人自然说话时，每个单词都会漂移到下一个单词中，导致单词之间的界限相当模糊。

一方面，以更加笨拙的方式说话似乎有助于计算机识别音素，但另一方面，它往往会降低理解更自然语音的可能性。

那些在该领域知识渊博的人谁可以建议哪两种方法更有效？

由于

1 个答案:

答案 0 :(得分：1)

连续语音识别是一个与“离散式听写”不同而且更加困难的问题（IBM研究员，我是一个非常初级成员的问题在大约25年前崩溃了;-)。如果“离散”语音对于给定的应用程序是可接受的，它肯定会给你更高的识别率（永远不会混淆“识别语音”与“破坏漂亮的海滩”;-)。但是，如果绝对不能接受，那么你就不应该使用它（根据“绝对”和“不可接受”的定义; - ）。