概率转移矩阵

时间:2009-12-12 12:17:58

标签: algorithm n-gram

我正在研究马尔可夫链,我想知道在给定文本文件作为输入的情况下构造概率转移矩阵(n阶)的有效算法。

我不是在使用一种算法,但我更愿意建立一个这样的算法列表。关于这些算法的论文也非常受欢迎,如术语等方面的任何提示。请注意,该主题与n-gram识别算法非常相似。

非常感谢任何帮助。

2 个答案:

答案 0 :(得分:1)

听起来有两个可能的问题,你应该澄清哪一个:

  1. “文本文件”包含概率值和“n”,您可以直接构建矩阵,但是如何对其进行编码?这个问题很简单,所以让我们无视它

  2. “文本文件”包含类似信号数据的内容,您希望将其建模为马尔可夫链。

  3. “马尔科夫链”通常指的是一阶随机过程,所以我不确定你的“顺序”是什么意思,可能是矩阵的大小,但这不是典型的术语。无论如何,对于一阶,n×n矩阵,离散时间随机过程,你应该看看维特比算法:http://en.wikipedia.org/wiki/Viterbi_algorithm

答案 1 :(得分:0)

每当处理马尔可夫模型时,我倾向于最终看crm114 Discriminator。其一,他详细介绍了实际上不同的模型(马尔科夫并不总是最好的,取决于应用程序是什么),并提供关于概率模型如何工作的一般链接和大量背景信息。虽然crm114通常用作某种SPAM识别工具,但它实际上是我在其他应用程序中使用的更通用的概率引擎。