我在R中合并了两个数据帧,当我检查str(data)
时,它显示某些因素有数百个级别,即使我检查数据帧时它只包含21个级别。
'data.frame': 21 obs. of 6 variables:
$ TrustName : Factor w/ 382 levels "#NAME?","2Gether NHS Foundation Trust",..: 14 17 18 55 73 93 104 107 116 121 ...
$ TrustCode : Factor w/ 317 levels " ","00D","00P",..: 134 86 122 205 154 241 194 152 208 306 ...
$ ResponseRate16: Factor w/ 70 levels "--","100","28",..: 18 21 17 23 8 31 35 13 30 17 ...
$ Base16 : Factor w/ 300 levels "--","1,039","1,057",..: 232 73 191 216 147 194 4 70 143 6 ...
$ ResponseRate15: Factor w/ 34 levels "27.29%","27.63%",..: 18 5 13 31 3 15 34 9 12 10 ...
$ Base15 : Factor w/ 34 levels "1,279","1,456",..: 23 7 18 12 31 19 28 6 15 32 ...
300级以上的因素是有问题的因素,因为它们总共只包含20到30个值。
我甚至在合并它们之前清除/删除了原始数据帧中的#NAME?
值,并检查它们是否已成功删除(已有)。
为什么会发生这种情况?如何解决这个问题以描绘更准确的图片?