为什么前向后向算法中的先验状态向量不是具有特征值为1的转移矩阵的特征向量?

时间:2012-07-23 21:12:08

标签: algorithm hidden-markov-models

维基百科说你不知道第一个状态是什么,所以你必须在先前的状态向量中分配每个状态的等概率。但是你确实知道转移概率矩阵是什么,并且具有该矩阵的特征值为1的特征向量是HMM中每个状态的频率(我认为),那么为什么不使用该向量用于先验状态向量而不是?

1 个答案:

答案 0 :(得分:2)

这确实是一个建模决策。你的建议当然是可能的,因为它几乎对应于在观察中加上一大段观察的前缀,其中隐藏的状态完全没有被观察到或者没有效果 - 这将给出原始状态时间到达均衡的时间。分布。

但是,如果您有一段分隔开始的观察,例如在说话者开始时开始的一段语音,或者从句子开头开始的一段文字,则没有特别的理由相信第一个状态的分布与均衡分布相同:我非常怀疑'e'是句子开头最常见的字符,而众所周知,它是英文文本中最常见的字符

您选择的内容可能并不重要,除非您有很多非常短的观察序列,您正在一起处理。大多数时候我只会担心你想将其中一个状态概率设置为零,因为经常用于优化HMM参数的EM算法或Baum-Welch算法可能不愿意从零开始重新估计参数。