我有一些以数字表示的过渡(将数字视为标签)
我有一些生成此类数据的代码。代码在R
中dataTrain=clusterSeq$FilteredMatrixFor90Percent[1:size,1:size]
dataTrain=matrix(1, nrow = 4, ncol = 4)
dataTrain[2,3]=3
dataTrain[1,3]=3
dataTrain[1,1]=2
dataTrain[1,4]=-1
dataTrain[2,4]=-1
dataTrain[1,1]=2
dataTrain[3,1]=3
> dataTrain
[,1] [,2] [,3] [,4]
[1,] 2 1 3 -1
[2,] 1 1 3 -1
[3,] 3 1 1 1
[4,] 1 1 1 1
每行现在是来自设备的一条记录,报告其状态更改。 例如,假设第1行是设备1:然后它经过以下状态:2-> 1-> 3(然后停止)。并非所有设备都报告相同的长度,因此在末尾附加-1以表示该长度并使条目具有相同的长度。
您刚刚注意到我有不同长度的报告。
我想为所有这些过渡构建一个简单的统计树。理想情况下,我也想做预测。 “如果输入为2-1,下一个转换是什么”。预测也可以认为是进一步修剪估计的树。
我已经读了很多书,看来马尔可夫链可能能够捕捉到这种动态。我仍然不确定这是否是正确的选择:
您能建议我一种可以处理此类数据的技术方法吗?我想要: 1.使用统计数据建立一些可视化,然后根据输入(变量输入,例如“ 2”,“ 2-1”,“ 3-1-1”)进行一些推断。
如果您能提供更多我应该阅读的内容,我将不胜感激。
谢谢 亚历克斯