seqecmpgroup()
函数返回一个表,其中包括每个指定组的频率。但是,当我运行它时,它会产生低于1的频率(例如0.00035)。我应该将这些频率解释为显示每个子序列发生在多少组中的百分比吗?
下面我贴了一个示例输出(每组的频率列为“Freq.1”,“Freq.2”等等:
Subsequence Support p.value statistic index Freq.1
1 (FA)-(IN)-(FA) 0.004807692 0.002293660 12.155213 538 0.000000000
2 (NR)-(TR)-(EX)-(IN) 0.004807692 0.002293660 12.155213 685 0.000000000
3 (NR)-(TR)-(IN)-(IN) 0.004807692 0.002293660 12.155213 687 0.000000000
4 (IS)-(IS)-(NR) 0.019230769 0.006788125 9.985161 98 0.040322581
5 (FA)-(NR)-(QU) 0.012820513 0.009031434 9.414088 172 0.008064516
Freq.2 Freq.3 Resid.1 Resid.2 Resid.3
1 0.000000000 0.02419355 -1.0919284 -1.100699 3.113347
2 0.000000000 0.02419355 -1.0919284 -1.100699 3.113347
3 0.000000000 0.02419355 -1.0919284 -1.100699 3.113347
4 0.007936508 0.00000000 2.3951978 -1.292885 -1.544220
5 0.003968254 0.04032258 -0.6614769 -1.241085 2.704727
Computed on 624 event sequences
Constraint Value
countMethod COBJ
答案 0 :(得分:2)
频率实际上是相对频率。它们对应于每个组内的相对支持,也就是说,它们为每个组指示组中包含子序列的序列的比例。
例如,我们从您的结果中了解到,前两个组中的第一个子序列(FA)-(IN)-(FA)
永远不会发生,并且是第三组序列的2.4%的子序列。
比例在提供时考虑了序列权重。
现在,我没有在您的示例输出中看到任何负频率。并且您指示的值0.00035不低于0!