markov-chains - 马尔可夫链如何工作以及什么是无记忆？

无记忆的想法是马尔可夫链成功的基础。这并不意味着我们不关心过去。相反，这意味着我们只保留过去最相关的信息来预测未来，并使用该信息来定义现在。这篇好文章提供了关于这个主题的良好背景 http://www.americanscientist.org/issues/pub/first-links-in-the-markov-chain

在描述过去的准确性和相关状态空间的大小之间存在权衡。比如说，附近有三家酒吧，每天晚上你选择一家。如果你随机选择那些酒吧，这不是马尔可夫链（或一个普通的，零级的） - 结果是随机的。更确切地说，它是一个独立的随机变量（建模依赖性是Markov链基础马尔可夫思想的基础）。

在您选择的酒吧中，您可以考虑最后的选择，即您前一天晚上去过哪家酒吧。例如，您可能希望避免连续两天前往同一个酒吧。虽然实际上这意味着要记住你昨天所处的位置（从而记住过去！），在你的建模级别，你的时间单位是一天，所以你现在的状态就是你昨天去过的酒吧。这是你的经典（一阶）马尔可夫模型，有三个状态和3乘3转移矩阵，为每个排列提供条件概率（如果昨天你去了酒吧I，今天你“跳”到酒吧J的变化是什么）。

但是，您可以定义一个“记住”过去两天的模型。在这个二阶马尔可夫模型中，“现在”状态将包括昨晚和前一天晚上酒吧的知识。现在您有9种可能的状态描述您的当前状态，因此您有一个9乘9的转换矩阵。值得庆幸的是，这个矩阵没有完全填充。

要了解原因，请在组织良好时考虑稍微不同的设置，以便根据最近两次访问为今天和明天的酒吧选择制定明确的计划。然后，您可以连续两天选择访问过的任何可能的酒吧排列。结果是一个完全填充的9乘9矩阵，将您最近两天的选择映射到接下来两天的选择。然而，在我们最初的问题中，我们每天都做出决定，所以我们未来的状态受到今天发生的事情的限制：在下一个时间步骤（明天）今天变为昨天，但它仍将是你对＃34的定义的一部分;今天＆＃34;在那个时间步骤，并与第二天发生的事情相关。这种情况类似于移动平均线或后退地平线程序。因此，从给定状态，您只能移动到三种可能的状态（表示您今天选择的酒吧），这意味着您的转换矩阵的每一行只有三个非零条目。

让我们计算出表征每个问题的参数数量：具有三个状态的零阶马尔可夫模型有两个独立的参数（击中第一个和第二个酒吧的概率，因为访问第三个酒吧的概率是前两者的补充）。一阶马尔可夫模型具有完全填充的3乘3矩阵，每列总计为1（再次表明其中一个酒吧将在任何给定的日期总是被访问），因此我们最终得到六个独立参数。二阶马尔可夫模型具有9乘9矩阵，每行只有3个非零项，所有列都加1，因此我们有18个独立参数。我们可以继续定义高阶模型，我们的状态空间也会相应增长。

重要的是，我们可以通过识别过去的重要特征来进一步细化概念，并仅使用那些特征来定义现在，即压缩关于过去的信息。这就是我在开始时提到的。例如，我们只能跟踪影响我们选择的一些令人难忘的事件，而不是记住所有历史记录，并使用这个“足够的统计数据”来构建模型。

这一切都归结为你定义相关变量（状态空间）的方式，马尔可夫概念自然地遵循基础数学概念。一阶（线性）关系（和相关的线性代数运算）是大多数当前数学应用的核心。您可以使用单个变量查看第n个多项式方程，或者可以通过定义辅助变量来定义n个方程的等效一阶（线性）系统。类似地，在经典力学中，您可以使用二阶拉格朗日方程或选择导致（一阶）哈密顿公式的典型坐标http://en.wikipedia.org/wiki/Hamiltonian_mechanics

最后，关于马尔可夫问题的稳态与瞬态解的说明。绝大多数实际应用（例如，页面排名）依赖于寻找稳态解决方案。实际上，这种趋向于稳定状态的存在是A.马尔科夫创造他的链的最初动机，以努力将中心极限定理的应用扩展到因变量。马尔可夫过程的瞬态效应（如击中次数）研究得少得多，而且更加模糊。然而，考虑马尔可夫对未来特定点结果的预测（而不仅仅是收敛的“均衡”解决方案）是完全有效的。

马尔可夫链如何工作以及什么是无记忆？

1 个答案: