我是R的新手,请原谅我的基本问题:
我的数据框有很多缺失的数据。我已经使用na.omit删除了丢失的数据,如下所示:
SELECT update_award.ID_No
FROM update_award
UNION
SELECT update_training.ID_No
FROM update_training
UNION
SELECT update_general_details.ID_No
FROM update_general
然而,一些变量是仍然似乎有的因素""作为分类之一,如:
data2 <- na.omit(data1)
当我看到&#34; data2&#34;它仍然有缺失值。我做错了什么?
非常感谢帮助和建议。
格雷格
答案 0 :(得分:0)
NA
与""
不同。
有什么区别?
NA
表示缺失值""
是一个空字符串,是一种值 na.omit
会删除NA
个值,但不会删除空字符串。
我建议在使用""
之前将NA
转换为na.omit
:
data1[data1$smoker == "", "smoker"] <- NA