无法理解seqefsub功能的输出

时间:2017-08-25 18:20:32

标签: r traminer

一个简单的例子:

t<-data.frame(id=rep(1:3, each=3), time=c(0,2,4,0,4,2,0,2,2), event=rep(c("A", "B", "C"), 3)) tmp<-seqecreate(t) seqefsub(tmp, min.support=2)

我得到了:

      Subsequence Support Count
      1         (A)       1     3
      2     (A)-(B)       1     3
      3     (A)-(C)       1     3
      4         (B)       1     3
      5         (C)       1     3

我无法理解为什么(A) - (B)和(A) - (C)计数为3。 我有三个序列:

    (A)-2-(B)-2-(C) 
    (A)-2-(C)-2-(B) 
    (A)-2-(B,C)

应该是:

      Subsequence Support Count
      1         (A)       1     3
      2         (B)       1     3
      3         (C)       1     3
      4     (A)-(B)       0.66  2
      5     (A)-(C)       0.66  2

非常感谢任何想法。

1 个答案:

答案 0 :(得分:1)

您将(A) - (B)计为3的原因是因为seqefsub将序列作为(A) - <anything can go here> - (B)的{​​{1}}读取,并且您有三个这种情况。

如果您想查看(A) - (B)连续发生且仅连续发生的子序列,请尝试:

(A) - (B)