在Hmisc(版本4.0-3)中使用describe()函数时,我一直在尝试协调一个问题。值摘要中的唯一值似乎已被更改或误解,因为它们与基本R中的table()函数的结果不匹配。
library(Hmisc)
test <- data.frame(
'j6033' = c(0, 0, 0, 0, 2053, 2098, 0, 2053, 2098, 2, 5, 0, 0, 0,
5, 13, 13, 0, 2053, 2098)
)
describe(test$j6033)
table(test$j6033)
我看到的结果是:
> describe(test$j6033)
test$j6033
n missing distinct Info Mean Gmd
20 0 6 0.902 624.5 920.6
Value 0 5 15 2055 2100
Frequency 10 2 2 3 3
Proportion 0.50 0.10 0.10 0.15 0.15
> table(test$j6033)
0 2 5 13 2053 2098
9 1 2 2 3 3
2053的值被解释为2055,单个值2被解释为0,2098被解释为2100,13被解释为15.有没有人知道为什么这里存在差异以及如何纠正它?
注意:支持Hmisc库调用加载的包版本如下:lattice(0.20-35),survival(2.41-3),Formula(1.2-2)和ggplot2(2.2.1)。
答案 0 :(得分:0)
当存在&lt; = 20个不同的值时,该函数在某些情况下舍入值。我已修复代码,如果有&lt; = 20值,则不进行此分区。这将在下一个版本中。如果需要,Linux用户可以提前获得新版本。