我正在努力使马尔可夫链适应网络会话。那些显然有不同的长度。下面是我尝试的代码,但它不起作用,我怀疑它可能是因为会话的长度不同。有人可以帮我诊断并解决问题吗?
library(markovchain)
mc_data <- aggregate(sessions[c("session_id","cs.uri.stem")], by=list(sessions$"session_id"), FUN=c)["cs.uri.stem"]
mc <- markovchainListFit(mc_data, byRow=TRUE)
汇总数据的测试数据(已汇总):
Group.1 session_id cs.uri.stem
1 1 1, 1, 1 /, /, /1127_about-us.aspx
2 2 2, 2 /, /1127_about-us.aspx
3 3 3 /
4 4 4 /
5 5 5 /
6 6 6 /
7 7 7 /
8 8 8 /
9 9 9 /
10 10 10 /
我得到的错误是这样的:
数据中的费勒[,c(i - 1,i)]:IndizierungaußerhalbderGrenzen
英文错误(谷歌翻译):
数据错误[c(i - 1,i)]:在边界之外编制索引