我正在使用包含以全部大写字母输入的名字的数据集。我需要将名称用作字符变量,而不是因子。
数据集中的一个人的名字是“NA”。我可以让R
接受“NA”作为合法的字符值吗?我的解决方案是重命名那个人NAA,但我很想知道是否有更好的方法。
答案 0 :(得分:1)
作为我评论的演示,请考虑以下示例CSV文件:
x <- tempfile()
cat("v1,v2", "NA,1", "AB,3", sep = "\n", file = x)
cat(readLines(x), sep = "\n")
# v1,v2
# NA,1
# AB,3
以下是基本str
的{{1}}。请注意,read.csv
被视为NA
NA
现在,指定一个不同的字符作为str(read.csv(x))
# 'data.frame': 2 obs. of 2 variables:
# $ v1: Factor w/ 1 level "AB": NA 1
# $ v2: int 1 3
参数:
na.strings