语音识别中的维特比强制对齐

时间:2020-04-13 14:34:31

标签: speech-recognition hidden-markov-models gmm

我试图理解语音识别中的GMM-HMM参数训练。

维特比力对准在训练过程中如何工作?

我目前的假设是,在训练期间,由于电话和观察已知,因此状态路径也已知。这称为维特比力对准吗?一旦知道状态路径,就可以使用Baum-Welch估算参数。是这样吗?

而且,一种状态可以与多个帧相关联,因为电话的发声可以扩展到多个帧。如何训练?

0 个答案:

没有答案