R Hmisc描述函数失真值摘要

时间:2017-12-06 16:54:16

标签: r hmisc

在Hmisc(版本4.0-3)中使用describe()函数时,我一直在尝试协调一个问题。值摘要中的唯一值似乎已被更改或误解,因为它们与基本R中的table()函数的结果不匹配。

library(Hmisc)

test <- data.frame(
        'j6033' = c(0, 0, 0, 0, 2053, 2098, 0, 2053, 2098, 2, 5, 0, 0, 0, 
                    5, 13, 13, 0, 2053, 2098)
        )

describe(test$j6033)
table(test$j6033)

我看到的结果是:

> describe(test$j6033)
test$j6033 
       n  missing distinct     Info     Mean      Gmd 
      20        0        6    0.902    624.5    920.6 

Value         0    5   15 2055 2100
Frequency    10    2    2    3    3
Proportion 0.50 0.10 0.10 0.15 0.15
> table(test$j6033)

   0    2    5   13 2053 2098 
   9    1    2    2    3    3 

2053的值被解释为2055,单个值2被解释为0,2098被解释为2100,13被解释为15.有没有人知道为什么这里存在差异以及如何纠正它?

注意:支持Hmisc库调用加载的包版本如下:lattice(0.20-35),survival(2.41-3),Formula(1.2-2)和ggplot2(2.2.1)。

1 个答案:

答案 0 :(得分:0)

当存在&lt; = 20个不同的值时,该函数在某些情况下舍入值。我已修复代码,如果有&lt; = 20值,则不进行此分区。这将在下一个版本中。如果需要,Linux用户可以提前获得新版本。