马尔可夫链和隐马尔可夫模型有什么区别?

时间:2012-05-25 04:21:40

标签: hidden-markov-models markov-chains markov

马尔可夫链模型和隐马尔可夫模型有什么区别?我在维基百科上读过,但无法理解这些差异。

5 个答案:

答案 0 :(得分:33)

通过示例解释,我将使用自然语言处理的示例。想象一下,你想知道这句话的可能性:

我喜欢咖啡

在马尔可夫模型中,您可以通过计算来估计其概率:

P(WORD = I) x P(WORD = enjoy | PREVIOUS_WORD = I) x P(word = coffee| PREVIOUS_WORD = enjoy)

现在,想象一下,我们想要知道这句话的词性标签,也就是说,如果一个单词是过去时动词,名词等等。

我们没有观察该句子中的任何词性标签,但我们假设他们在那里。因此,我们计算了词性标签序列的概率。在我们的例子中,实际的顺序是:

  

PRP-VBP-NN

(其中PRP =“人称代词”,VBP =“动词,非第三人称单数”,NN =“名词,单数或质量”。有关Penn POS的完整表示,请参阅https://cs.nyu.edu/grishman/jet/guide/PennPOS.html标记)

但是等等!这是我们可以应用马尔可夫模型的序列。但我们称之为隐藏,因为从不直接观察到词性序列。当然,在实践中,我们将计算许多这样的序列,并且我们希望找到最能解释我们观察的隐藏序列(例如,我们更有可能看到诸如'',&# 39;这个',由确定器(DET)标签生成

我遇到过的最好的解释是劳伦斯·R·拉宾纳在1989年的一篇论文中:http://www.cs.ubc.ca/~murphyk/Bayes/rabiner.pdf

答案 1 :(得分:23)

Markov模型是状态机,状态变化是概率。在隐马尔可夫模型中,您不知道概率,但您知道结果。

例如,当您翻转硬币时,您可以获得概率,但是,如果您看不到翻转并且有人在每个硬币翻转时移动五个手指中的一个,您可以采取手指动作并使用隐藏马尔可夫模型,以获得最佳的硬币翻转猜测。

答案 2 :(得分:5)

据我了解,问题是:马尔可夫过程和隐马尔可夫过程有什么区别?

马尔可夫过程(MP)是一个随机过程:

  1. 有限数量的州
  2. 这些状态之间的概率转换
  3. 下一个状态仅由当前状态(马尔可夫属性)确定
  4. 隐马尔可夫过程(HMM)也是一个随机过程:

    1. 有限数量的州
    2. 这些状态之间的概率转换
    3. 下一个状态仅由当前状态(马尔可夫属性)和
    4. 确定
    5. 我们不确定我们所处的状态:当前状态会发出一个观察结果。
    6. 示例 - (HMM)股票市场
      在股票市场,人们用公司的价值进行交易。让我们假设共享的实际价值是100美元(这是不可观察的,事实上你永远不会知道它)。你真正看到的是它交易的价值:我们假设在这种情况下是90美元(这是可观察的)。

      对于对Markov感兴趣的人:有趣的部分是当你开始对这些模型采取行动时(在前面的例子中,为了赚钱)。这适用于马尔可夫决策过程(MDP)和部分可观察马尔可夫决策过程(POMDP)。为了评估这些模型的一般分类,我在下图中总结了每个马尔可夫模型的主要特征。

      Classification of different Markov Models

答案 3 :(得分:4)

由于Matt使用词性标签作为HMM示例,我可以再添加一个例子:语音识别。几乎所有大词汇量连续语音识别(LVCSR)系统都基于HMM。

“马特的例子”: 我喜欢咖啡

在马尔可夫模型中,您可以通过计算来估算其概率:

P(WORD = I) x P(WORD = enjoy | PREVIOUS_WORD = I) x P(word = coffee| PREVIOUS_WORD = enjoy)

在隐马尔可夫模型中,

让我们说30个不同的人阅读“我喜欢拥抱”这句话,我们必须认识它。 每个人都会以不同的方式发音。所以我们不知道这个人是否意味着“拥抱”或“唠叨”。我们只会得到实际单词的概率分布。

简而言之,隐马尔可夫模型是一种统计马尔可夫模型,其中被建模的系统被假定为具有未观察(隐藏)状态的马尔可夫过程。

答案 4 :(得分:1)

隐马尔可夫模型是一个双嵌入随机过程,有两个层次。

上层是马尔可夫过程,状态是不可观察的。

事实上,观察是上层马尔可夫状态的概率函数。

不同的马尔可夫状态将具有不同的观察概率函数。