我正在研究马尔可夫链,我想知道在给定文本文件作为输入的情况下构造概率转移矩阵(n阶)的有效算法。
我不是在使用一种算法,但我更愿意建立一个这样的算法列表。关于这些算法的论文也非常受欢迎,如术语等方面的任何提示。请注意,该主题与n-gram识别算法非常相似。
非常感谢任何帮助。
答案 0 :(得分:1)
听起来有两个可能的问题,你应该澄清哪一个:
“文本文件”包含概率值和“n”,您可以直接构建矩阵,但是如何对其进行编码?这个问题很简单,所以让我们无视它
“文本文件”包含类似信号数据的内容,您希望将其建模为马尔可夫链。
答案 1 :(得分:0)
每当处理马尔可夫模型时,我倾向于最终看crm114 Discriminator。其一,他详细介绍了实际上不同的模型(马尔科夫并不总是最好的,取决于应用程序是什么),并提供关于概率模型如何工作的一般链接和大量背景信息。虽然crm114通常用作某种SPAM识别工具,但它实际上是我在其他应用程序中使用的更通用的概率引擎。