将因子转换为数字而不丢失信息R(as.numeric()似乎不起作用)

时间:2011-09-30 14:26:33

标签: r r-factor

  

可能重复:
  R - How to convert a factor to an integer\numeric in R without a loss of information

关于as.numeric()函数的以下事实已引起我的注意

> blah<-c("4","8","10","15")
> blah
[1] "4"  "8"  "10" "15"
> blah.new<-as.factor(blah)
> blah.new
[1] 4  8  10 15
Levels: 10 15 4 8
> blah.new1<-as.numeric(blah.new)
> blah.new1
[1] 3 4 1 2

当我使用as.numeric()将具有4,8,10和15级别的因子转换为定量变量时,每个数字都会转换为排名,原始值将丢失。

如何获取级别为10,15,4和8的向量'blah.new',并将其转换为数值10,15,4和8?

(出现这个问题是因为read.table()读取定量变量的数据集是一个因素)

谢谢!!!!

*****更新:计算出来了

blah.new1<-as.numeric(as.character(blah.new))

但是,我想知道as.numeric()的文档在哪里说这个函数将参数转换为排名列表?

1 个答案:

答案 0 :(得分:28)

首先,因素包括指数和水平。当你在与因素斗争时,这个事实非常重要。

例如,

> z <- factor(letters[c(3, 2, 3, 4)])

# human-friendly display, but internal structure is invisible
> z
[1] c b c d
Levels: b c d

# internal structure of factor
> unclass(z)
[1] 2 1 2 3
attr(,"levels")
[1] "b" "c" "d"

这里,z有4个元素。
索引按此顺序为2, 1, 2, 3 级别与每个索引相关联:1 - &gt; b,2 - &gt; c,3 - &gt; d。

然后,as.numeric只将因子的索引部分转换为数字 as.character处理索引和级别,并生成由级别表示的字符向量。

?as.numeric表示因素由默认方法处理