维特比搜索 - 假设概率

时间:2012-11-29 18:35:15

标签: algorithm probability hidden-markov-models viterbi

我正在构建一个隐马尔可夫模型,以确定某人是否说“是”或“否”。我开发了隐马尔可夫模型,我从这个页面看到了一个教程:

http://www.cslu.ogi.edu/tutordemos/nnet_recog/recog.html

在本教程中它说:

  

该图通过假设的概率矩阵追踪“是”和“否”的搜索路径。即使“否”的得分非常低,如果“是”还没有出现在我们的词汇表中,仍然有可能找到这个词最可能的路径。通过阅读以下伪代码算法可以理解维特比搜索(借用Rabiner的论文,隐藏马尔可夫模型教程和语音识别中的选定应用):

我已阅读了两篇论文,我仍然对他们所说的内容感到困惑:

through a hypothetical matrix of probabilities

我的问题是这个概率矩阵来自哪里?例如,我已经完成了以下操作:

  • 读入音频文件
  • 剥离了无需考虑的音频信号
  • 将有争议的信号拆分成块

这意味着我留下了包含音素的块。我已经计算了数据的过零点,因此我想到了我的观点:

对于“否”,此数据非常低,

对于“是”,此数据非常高。

所以在上面给出的例子中,它说:

Even though the score for "no" is very low,

那么我可以将零交叉的结果作为我的概率传递给我吗?我很困惑,希望有人可以帮助我。

1 个答案:

答案 0 :(得分:2)

在哲学意义上,这个概率矩阵来自自然。更严重的是,这个矩阵代表了转换矩阵的概念,它可以由Baum Welch在采样数据上计算,如果一个人不“知道”自然的真实分布(没有人这样做)。这就是他们说这是假设的原因。

关于你的第二个问题,你需要通过将Baum Welch应用到零交叉样本来获得Transition矩阵(概率)(我不确定过零样本是什么,通常mfcc用于此类事情)。

如果需要进一步澄清或者我误解了某些内容,请告诉我。