R:将数据帧行转换为字符向量

时间:2014-06-30 14:26:33

标签: string r vector type-conversion

简短版:

尝试将数据帧的单行转换为字符向量时,我不理解as.character的行为。

> mydf <- data.frame("myvar1"=c("mystring","2"),"myvar2"=c("mystring","3"))
> mydf # nice!
myvar1   myvar2
1 mystring mystring
2        2        3
> as.character(mydf[1,])
[1] "2" "2"
> as.character(as.vector(mydf[1,]) ) 
[1] "2" "2"

也许有人可以给我一个关于最后2个输出线和正确方法的解释?非常感谢。

背景/目的:

我想使用lre()来检测数据帧的一行中连续出现的值(使用不同数据类型的列)。

问题:lre()需要一个向量,向量需要一个明确的数据类型(整数,字符,因子,......)。我的想法是将数据帧行转换为字符向量,以避免通过转换丢失数据。

2 个答案:

答案 0 :(得分:8)

您的数据框列不是字符,它们是因素。

创建数据框时,默认值是字符是因子。如果选择列

,您可以清楚地看到这一点
R> mydf[,1]
[1] mystring 2       
Levels: 2 mystring

要避免此行为,请将stringsAsFactors参数设置为FALSE

mydf = data.frame("myvar1"=c("mystring", "2"),
                    "myvar2"=c("mystring", "3"), 
                     stringsAsFactors=FALSE)

您还应该看看这个问题:How to convert a data frame column to numeric type?

答案 1 :(得分:4)

试试这个:

 mydf <- data.frame("myvar1"=c("mystring","2"),"myvar2"=c("mystring","3"), stringsAsFactors=F)
 as.character(mydf[1,])
 [1] "mystring" "mystring"

你的字符串被强制成因子,并且你已经显示了因子水平。