因子表与字符表之间的差异

时间:2016-01-15 09:01:43

标签: r r-factor

任何人都可以向我解释下面的区别是什么:

 length(table(ari_kiddivax_temp$SAMPLE_ID))

给出2165

length(table(as.character(ari_kiddivax_temp$SAMPLE_ID)))

给出1439

我有来自R的输出:

class(ari_kiddivax_temp$SAMPLE_ID)
[1] "factor"

head(ari_kiddivax_temp$SAMPLE_ID)
[1] 91010 91010 91010 91010 91011 91011
2165 Levels: 91010 91011 91012 91013 91020 91021 91022 91030 91031 91032 91033 91040 91041 91042 91043 ... 2754

有人可以解释为什么他们不同吗?一个给了我2165,另一个给了1439.添加" as.character"必须有一些区别。在那里。但我不知道为什么会有所作为以及它如何产生影响。

P.S。另外,避免犯这种愚蠢错误的最佳方法是什么?

0 个答案:

没有答案