拨浪鼓"信息"分数描述数据集

时间:2016-10-18 14:04:31

标签: r rattle

在拨浪鼓中运行描述性统计数据,并且需要知道"信息"在结果中。未能在小插图中找到任何信息。以下是我所说的一个例子:

Variable1 
      n missing  unique    Info    Sum    Mean 
  89588       0       2    0.61   25735  0.2873 

我们认为它是0到1的分数,但我们无法找到确切的定义。

1 个答案:

答案 0 :(得分:3)

Rattle中使用的describe函数来自HMisc包。

在HMisc :: describe的文档中,这是关于Info:

的说法
  

对于数值变量,describe会添加一个名为Info的项目,即a   利用相对效率的相对信息度量   比例赔率/ Wilcoxon检验变量相对于相同   测试没有关系的变量。信息与连续性有关   变量是,并且绑定对更多未解决的值的危害较小   有。 Info的公式是一减去多维数据集的总和   值的相对频率除以1减去平方的平方   样本大小的倒数。最低的信息来自a   变量只有一个唯一值后跟高度倾斜   二进制变量。信息报告到小数点后两位。