seqecmpgroup()函数的输出格式?

时间:2015-01-14 16:08:17

标签: r traminer sequence-analysis

seqecmpgroup()函数返回一个表,其中包括每个指定组的频率。但是,当我运行它时,它会产生低于1的频率(例如0.00035)。我应该将这些频率解释为显示每个子序列发生在多少组中的百分比吗?

下面我贴了一个示例输出(每组的频率列为“Freq.1”,“Freq.2”等等:

      Subsequence     Support     p.value statistic index      Freq.1
1      (FA)-(IN)-(FA) 0.004807692 0.002293660 12.155213   538 0.000000000
2 (NR)-(TR)-(EX)-(IN) 0.004807692 0.002293660 12.155213   685 0.000000000
3 (NR)-(TR)-(IN)-(IN) 0.004807692 0.002293660 12.155213   687 0.000000000
4      (IS)-(IS)-(NR) 0.019230769 0.006788125  9.985161    98 0.040322581
5      (FA)-(NR)-(QU) 0.012820513 0.009031434  9.414088   172 0.008064516
       Freq.2     Freq.3    Resid.1   Resid.2   Resid.3
1 0.000000000 0.02419355 -1.0919284 -1.100699  3.113347
2 0.000000000 0.02419355 -1.0919284 -1.100699  3.113347
3 0.000000000 0.02419355 -1.0919284 -1.100699  3.113347
4 0.007936508 0.00000000  2.3951978 -1.292885 -1.544220
5 0.003968254 0.04032258 -0.6614769 -1.241085  2.704727

Computed on 624 event sequences
  Constraint Value
  countMethod  COBJ

1 个答案:

答案 0 :(得分:2)

频率实际上是相对频率。它们对应于每个组内的相对支持,也就是说,它们为每个组指示组中包含子序列的序列的比例。

例如,我们从您的结果中了解到,前两个组中的第一个子序列(FA)-(IN)-(FA)永远不会发生,并且是第三组序列的2.4%的子序列。

比例在提供时考虑了序列权重。

现在,我没有在您的示例输出中看到任何负频率。并且您指示的值0.00035不低于0!