一个小小的左侧领域,但我正在尝试训练一个语音识别程序,指南建议我尝试清楚但自然地说话。然而,我注意到,当一个人自然说话时,每个单词都会漂移到下一个单词中,导致单词之间的界限相当模糊。
一方面,以更加笨拙的方式说话似乎有助于计算机识别音素,但另一方面,它往往会降低理解更自然语音的可能性。
那些在该领域知识渊博的人谁可以建议哪两种方法更有效?
由于
答案 0 :(得分:1)
连续语音识别是一个与“离散式听写”不同而且更加困难的问题(IBM研究员,我是一个非常初级成员的问题在大约25年前崩溃了;-)。如果“离散”语音对于给定的应用程序是可接受的,它肯定会给你更高的识别率(永远不会混淆“识别语音”与“破坏漂亮的海滩”;-)。但是,如果绝对不能接受,那么你就不应该使用它(根据“绝对”和“不可接受”的定义; - )。