read.table读取“T”为TRUE,“F”为FALSE,如何避免?

时间:2013-04-25 12:14:50

标签: r read.table

我有一个包含数据c("A","T","B","F")的文件。

当我使用时:

read.csv(myfile,header=F,stringsAsFactors=F)

R将字符T解释为TRUE,将F解释为FALSE

我做错了吗?

3 个答案:

答案 0 :(得分:19)

如果您的所有列都是字符,请尝试以下操作:

# replace text = . with your filename
read.csv(text="A,B,T,T", header=FALSE, stringsAsFactors=FALSE, 
            colClasses = c("character"))

否则,您必须将colClasses中每列的类型传递为:colClasses = c("numeric", "numeric", "character", ...)

答案 1 :(得分:1)

我遇到的类似问题是解决方案:

#dummy data
df <- read.csv(text="
A,B,T,T,F
T,T,F,T,text1
A,T,NA,F,T",
               header=FALSE, stringsAsFactors=FALSE)
#data
df
#   V1 V2    V3    V4    V5
# 1  A  B  TRUE  TRUE     F
# 2  T  T FALSE  TRUE text1
# 3  A  T    NA FALSE     T

#convert logical columns to single letters
df[,sapply(df,class) == "logical"] <-
  sapply(df[,sapply(df,class) == "logical"],
         function(i) substr(as.character(i),1,1))

#result
df
#   V1 V2   V3 V4    V5
# 1  A  B    T  T     F
# 2  T  T    F  T text1
# 3  A  T <NA>  F     T

答案 2 :(得分:1)

如果您不想更改所有列的类,重新评估也可以,但最好只对一列进行简单更改。

df$V3 <- as.factor(revalue(df$V3, c("TRUE" = "T", "FALSE" = "F")))