从HMM-GMM中的语音识别纸了解变量

时间:2020-07-16 18:18:06

标签: speech-recognition hidden-markov-models gmm

我正在阅读Mark Gales和Steve Young撰写的this论文,内容涉及使用HMM-GMM进行语音识别。在第205页第二段中,其内容为:

对于每个发声Y (r),r = 1,。。。,R,长度T (r)找到与话语中的单词序列相对应的HMM,并构建相应的复合HMM

我不清楚Y (r)和Tsup>(r)是什么?有人可以澄清吗?我不明白 r R 代表什么?

this论文中,标题为:使用图形处理单元并行执行维特比声学模型训练,在第2.1节中,作者提到:

给定一组训练观测值Osup>(r),1≤r≤R且HMM状态序列1

我知道两个句子都相似,但是在上面的论文中,我也不明白什么是 r R

1 个答案:

答案 0 :(得分:0)

在HMM中,您有按时间顺序观察。语音识别是一项特殊的任务,因为观察长度不是固定的而是可变的。

据我所知,观测值Y(r)表示为:

Y(r)= {Y_0,Y_1,Y_2,...,Y_R} 因此r是r = 0、1,...,R的索引。

在这种情况下,r是观测值的计数,R是最后一个观测值。