我有一个data.frame(40K行)。
[,1] [,2] [,3] [,4] [,5]
[1,] "state 1" "state 3" NA NA NA
[2,] "state 2" "state 4" "state 4" NA NA
[3,] "state 2" "state 4" "state 5" "state 3" "state 82"
每行包含有关状态序列的信息。状态数是固定的(~200)。序列长度各不相同。
是否可以执行一些函数来查找具有最大概率的乘法序列:
get_rank_seq(df = myframe, states = levels(as.factor(c(myframe))) )
我不想将“模型”应用于测试数据。仅需要分析原始数据集。我认为这个问题是基于语言处理和HMM。
感谢所有人。