Markov-Chain,统计树,什么更合适

时间:2019-06-28 13:59:04

标签: tree statistics inference markov

我有一些以数字表示的过渡(将数字视为标签)

我有一些生成此类数据的代码。代码在R

dataTrain=clusterSeq$FilteredMatrixFor90Percent[1:size,1:size]
dataTrain=matrix(1, nrow = 4, ncol = 4)
dataTrain[2,3]=3
dataTrain[1,3]=3
dataTrain[1,1]=2
dataTrain[1,4]=-1
dataTrain[2,4]=-1
dataTrain[1,1]=2
dataTrain[3,1]=3
> dataTrain
     [,1] [,2] [,3] [,4]
[1,]    2    1    3   -1
[2,]    1    1    3   -1
[3,]    3    1    1    1
[4,]    1    1    1    1

每行现在是来自设备的一条记录,报告其状态更改。 例如,假设第1行是设备1:然后它经过以下状态:2-> 1-> 3(然后停止)。并非所有设备都报告相同的长度,因此在末尾附加-1以表示该长度并使条目具有相同的长度。

您刚刚注意到我有不同长度的报告。

我想为所有这些过渡构建一个简单的统计树。理想情况下,我也想做预测。 “如果输入为2-1,下一个转换是什么”。预测也可以认为是进一步修剪估计的树。

我已经读了很多书,看来马尔可夫链可能能够捕捉到这种动态。我仍然不确定这是否是正确的选择:

  1. 序列的长度不一样
  2. 不应考虑到-1的转换。例如,在第一行中,我已经解释过的3-> -1不是过渡。

您能建议我一种可以处理此类数据的技术方法吗?我想要: 1.使用统计数据建立一些可视化,然后根据输入(变量输入,例如“ 2”,“ 2-1”,“ 3-1-1”)进行一些推断。

如果您能提供更多我应该阅读的内容,我将不胜感激。

谢谢 亚历克斯

0 个答案:

没有答案