简短版:
尝试将数据帧的单行转换为字符向量时,我不理解as.character的行为。
> mydf <- data.frame("myvar1"=c("mystring","2"),"myvar2"=c("mystring","3"))
> mydf # nice!
myvar1 myvar2
1 mystring mystring
2 2 3
> as.character(mydf[1,])
[1] "2" "2"
> as.character(as.vector(mydf[1,]) )
[1] "2" "2"
也许有人可以给我一个关于最后2个输出线和正确方法的解释?非常感谢。
背景/目的:
我想使用lre()
来检测数据帧的一行中连续出现的值(使用不同数据类型的列)。
问题:lre()
需要一个向量,向量需要一个明确的数据类型(整数,字符,因子,......)。我的想法是将数据帧行转换为字符向量,以避免通过转换丢失数据。
答案 0 :(得分:8)
您的数据框列不是字符,它们是因素。
创建数据框时,默认值是字符是因子。如果选择列
,您可以清楚地看到这一点R> mydf[,1]
[1] mystring 2
Levels: 2 mystring
要避免此行为,请将stringsAsFactors
参数设置为FALSE
mydf = data.frame("myvar1"=c("mystring", "2"),
"myvar2"=c("mystring", "3"),
stringsAsFactors=FALSE)
您还应该看看这个问题:How to convert a data frame column to numeric type?
答案 1 :(得分:4)
试试这个:
mydf <- data.frame("myvar1"=c("mystring","2"),"myvar2"=c("mystring","3"), stringsAsFactors=F)
as.character(mydf[1,])
[1] "mystring" "mystring"
你的字符串被强制成因子,并且你已经显示了因子水平。