如何知道数据集中有多少个NA值?或者,如果数据集中有任何NA和NaN?
答案 0 :(得分:4)
这也可以正常使用
sum(is.na(df)) # For entire dataset
表示数据集中的特定列
sum(is.na(df$col1))
或者检查@nicola
提到的所有列colSums(is.na(df))
答案 1 :(得分:2)
正如 @Roland 注意到,在R中有多个查找和处理缺失值的函数(参见help("NA")
和here)。
示例:的
创建一个包含NA
个
data <- matrix(1:300,,3)
data[sample(300, 40)] <- NA
检查是否有任何缺失值:
anyNA(data)
逐列检查是否有任何缺失值:
apply(data, 2, anyNA)
检查列中缺失值的百分比和计数:
colMeans(is.na(data))*100
colSums(is.na(data))