为什么在str(数据)中列出了不可见/可访问的额外级别?

时间:2017-03-17 13:11:06

标签: r dataframe

我在R中合并了两个数据帧,当我检查str(data)时,它显示某些因素有数百个级别,即使我检查数据帧时它只包含21个级别。

'data.frame':   21 obs. of  6 variables:
$ TrustName     : Factor w/ 382 levels "#NAME?","2Gether NHS Foundation Trust",..: 14 17 18 55 73 93 104 107 116 121 ...
$ TrustCode     : Factor w/ 317 levels " ","00D","00P",..: 134 86 122 205 154 241 194 152 208 306 ...
$ ResponseRate16: Factor w/ 70 levels "--","100","28",..: 18 21 17 23 8 31 35 13 30 17 ...
$ Base16        : Factor w/ 300 levels "--","1,039","1,057",..: 232 73 191 216 147 194 4 70 143 6 ...
$ ResponseRate15: Factor w/ 34 levels "27.29%","27.63%",..: 18 5 13 31 3 15 34 9 12 10 ...
$ Base15        : Factor w/ 34 levels "1,279","1,456",..: 23 7 18 12 31 19 28 6 15 32 ...

300级以上的因素是有问题的因素,因为它们总共只包含20到30个值。

我甚至在合并它们之前清除/删除了原始数据帧中的#NAME?值,并检查它们是否已成功删除(已有)。

为什么会发生这种情况?如何解决这个问题以描绘更准确的图片?

0 个答案:

没有答案