一个简单的例子:
t<-data.frame(id=rep(1:3, each=3), time=c(0,2,4,0,4,2,0,2,2), event=rep(c("A", "B", "C"), 3))
tmp<-seqecreate(t)
seqefsub(tmp, min.support=2)
我得到了:
Subsequence Support Count
1 (A) 1 3
2 (A)-(B) 1 3
3 (A)-(C) 1 3
4 (B) 1 3
5 (C) 1 3
我无法理解为什么(A) - (B)和(A) - (C)计数为3。 我有三个序列:
(A)-2-(B)-2-(C)
(A)-2-(C)-2-(B)
(A)-2-(B,C)
应该是:
Subsequence Support Count
1 (A) 1 3
2 (B) 1 3
3 (C) 1 3
4 (A)-(B) 0.66 2
5 (A)-(C) 0.66 2
非常感谢任何想法。
答案 0 :(得分:1)
您将(A) - (B)
计为3的原因是因为seqefsub
将序列作为(A) - <anything can go here> - (B)
的{{1}}读取,并且您有三个这种情况。
如果您想查看(A) - (B)
连续发生且仅连续发生的子序列,请尝试:
(A) - (B)