Question

我有一个包含数据c("A","T","B","F")的文件。

当我使用时：

read.csv(myfile,header=F,stringsAsFactors=F)

R将字符T解释为TRUE，将F解释为FALSE

我做错了吗？

Answer 1

如果您的所有列都是字符，请尝试以下操作：

# replace text = . with your filename
read.csv(text="A,B,T,T", header=FALSE, stringsAsFactors=FALSE, 
            colClasses = c("character"))

否则，您必须将colClasses中每列的类型传递为：colClasses = c("numeric", "numeric", "character", ...)

Answer 2

我遇到的类似问题是解决方案：

#dummy data
df <- read.csv(text="
A,B,T,T,F
T,T,F,T,text1
A,T,NA,F,T",
               header=FALSE, stringsAsFactors=FALSE)
#data
df
#   V1 V2    V3    V4    V5
# 1  A  B  TRUE  TRUE     F
# 2  T  T FALSE  TRUE text1
# 3  A  T    NA FALSE     T

#convert logical columns to single letters
df[,sapply(df,class) == "logical"] <-
  sapply(df[,sapply(df,class) == "logical"],
         function(i) substr(as.character(i),1,1))

#result
df
#   V1 V2   V3 V4    V5
# 1  A  B    T  T     F
# 2  T  T    F  T text1
# 3  A  T <NA>  F     T

Answer 3

如果您不想更改所有列的类，重新评估也可以，但最好只对一列进行简单更改。

df$V3 <- as.factor(revalue(df$V3, c("TRUE" = "T", "FALSE" = "F")))

read.table读取“T”为TRUE，“F”为FALSE，如何避免？

3 个答案: