arules包中的interestMeasure函数的度量范围,R与包manul中的描述不同

时间:2017-07-10 05:34:33

标签: r arules kappa

我正在使用artules包,R找到积极相关的产品。我使用函数interestMeasure提供的一些度量来评估规则。但是,我发现kappa和leastContradiction的测量范围与包装手册不同。这是一个例子,代码在包装手册中对interestMeasure的解释:

data("Income")
rules <- apriori(Income)
quality(rules)$kappa <- interestMeasure(rules,measure='kappa',transactions = Income)
quality(rules)$leastContradiction <- interestMeasure(rules,measure='leastContradiction',transactions = Income)
try <- as(rules,'data.frame')
为方便起见,我稍微改了一下。在该示例中,leastContradiction和kappa的范围是:

> summary(try$leastContradiction)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
0.08794 0.13920 0.17000 0.18930 0.22170 0.90460 
> summary(try$kappa)
     Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
-43160000 -20510000 -19140000 -17660000 -12220000  -8042000 

我在自己的数据上尝试了这两项措施,摘要是:

> summary(myData1$kappa)
          Min.        1st Qu.         Median           Mean        3rd Qu.           Max. 
-5767000000000 -5765000000000 -5756000000000 -5745000000000 -5728000000000 -5610000000000 
> summary(myData1$leastContradiction)
     Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
-218.9000   -5.4530   -2.0120   -4.9540   -1.1050    0.8824 

但是,在包装手册中,这两个措施的解释如下: enter image description here

可以看出范围非常不同。那么,我应该自己将这些措施的范围缩小到[-1,1]吗?

1 个答案:

答案 0 :(得分:1)

这确实是一个错误。分辨率:在kappa计算中添加了缺失的括号,并为最小的矛盾添加了固定的等式。该修复程序现在可以在github上的开发版本中使用,并将成为下一个版本的一部分(arules 1.2-3)。