马尔可夫链如何工作以及什么是无记忆?

时间:2013-12-15 14:26:46

标签: markov-chains markov markov-models

Markov Chains如何运作?我已经阅读了Markov Chain的维基百科,但我没有得到的是无记忆。无记忆表明:

  

下一个状态仅取决于当前状态而不取决于当前状态   之前的事件序列。

如果马尔可夫链具有这种性质,那么马尔可夫模型中链的用途是什么? 解释这个属性。

1 个答案:

答案 0 :(得分:4)

无记忆的想法是马尔可夫链成功的基础。这并不意味着我们不关心过去。相反,这意味着我们只保留过去最相关的信息来预测未来,并使用该信息来定义现在。 这篇好文章提供了关于这个主题的良好背景 http://www.americanscientist.org/issues/pub/first-links-in-the-markov-chain

在描述过去的准确性和相关状态空间的大小之间存在权衡。比如说,附近有三家酒吧,每天晚上你选择一家。如果你随机选择那些酒吧,这不是马尔可夫链(或一个普通的,零级的) - 结果是随机的。更确切地说,它是一个独立的随机变量(建模依赖性是Markov链基础马尔可夫思想的基础)。

在您选择的酒吧中,您可以考虑最后的选择,即您前一天晚上去过哪家酒吧。例如,您可能希望避免连续两天前往同一个酒吧。虽然实际上这意味着要记住你昨天所处的位置(从而记住过去!),在你的建模级别,你的时间单位是一天,所以你现在的状态就是你昨天去过的酒吧。这是你的经典(一阶)马尔可夫模型,有三个状态和3乘3转移矩阵,为每个排列提供条件概率(如果昨天你去了酒吧I,今天你“跳”到酒吧J的变化是什么) 。

但是,您可以定义一个“记住”过去两天的模型。在这个二阶马尔可夫模型中,“现在”状态将包括昨晚和前一天晚上酒吧的知识。现在您有9种可能的状态描述您的当前状态,因此您有一个9乘9的转换矩阵。值得庆幸的是,这个矩阵没有完全填充。

要了解原因,请在组织良好时考虑稍微不同的设置,以便根据最近两次访问为今天和明天的酒吧选择制定明确的计划。然后,您可以连续两天选择访问过的任何可能的酒吧排列。结果是一个完全填充的9乘9矩阵,将您最近两天的选择映射到接下来两天的选择。然而,在我们最初的问题中,我们每天都做出决定,所以我们未来的状态受到今天发生的事情的限制:在下一个时间步骤(明天)今天变为昨天,但它仍将是你对#34的定义的一部分;今天"在那个时间步骤,并与第二天发生的事情相关。这种情况类似于移动平均线或后退地平线程序。因此,从给定状态,您只能移动到三种可能的状态(表示您今天选择的酒吧),这意味着您的转换矩阵的每一行只有三个非零条目。

让我们计算出表征每个问题的参数数量:具有三个状态的零阶马尔可夫模型有两个独立的参数(击中第一个和第二个酒吧的概率,因为访问第三个酒吧的概率是前两者的补充)。一阶马尔可夫模型具有完全填充的3乘3矩阵,每列总计为1(再次表明其中一个酒吧将在任何给定的日期总是被访问),因此我们最终得到六个独立参数。二阶马尔可夫模型具有9乘9矩阵,每行只有3个非零项,所有列都加1,因此我们有18个独立参数。 我们可以继续定义高阶模型,我们的状态空间也会相应增长。

重要的是,我们可以通过识别过去的重要特征来进一步细化概念,并仅使用那些特征来定义现在,即压缩关于过去的信息。这就是我在开始时提到的。例如,我们只能跟踪影响我们选择的一些令人难忘的事件,而不是记住所有历史记录,并使用这个“足够的统计数据”来构建模型。

这一切都归结为你定义相关变量(状态空间)的方式,马尔可夫概念自然地遵循基础数学概念。一阶(线性)关系(和相关的线性代数运算)是大多数当前数学应用的核心。您可以使用单个变量查看第n个多项式方程,或者可以通过定义辅助变量来定义n个方程的等效一阶(线性)系统。类似地,在经典力学中,您可以使用二阶拉格朗日方程或选择导致(一阶)哈密顿公式的典型坐标http://en.wikipedia.org/wiki/Hamiltonian_mechanics

最后,关于马尔可夫问题的稳态与瞬态解的说明。绝大多数实际应用(例如,页面排名)依赖于寻找稳态解决方案。实际上,这种趋向于稳定状态的存在是A.马尔科夫创造他的链的最初动机,以努力将中心极限定理的应用扩展到因变量。马尔可夫过程的瞬态效应(如击中次数)研究得少得多,而且更加模糊。然而,考虑马尔可夫对未来特定点结果的预测(而不仅仅是收敛的“均衡”解决方案)是完全有效的。