我正在尝试使用R中的na.omit()函数删除我的数据中的所有NAs。但是,该函数会丢弃我在数据中的所有观察结果,尽管只有两个NAs用于教育变量。以下是R输出:
> dim(data)
[1] 146688 167
> sum(is.na(data$educ))
[1] 2
> data2 = na.omit(data$educ)
> dim(data2)
NULL
sum(is.na())函数只计算两个NA,所以na.omit()应该只删除两行,对吗?为什么函数会丢弃我的所有观察结果?
答案 0 :(得分:2)
执行此操作的一种简单方法是对数据进行分组。此外,您可能希望尝试使用表函数来查看变量是否缺失。
table(is.na(data$educ))
test <- subset(data, is.na(educ)) # So you can look at the 2 observations missing this variable
data2 <- subset(data, !is.na(educ))