如何计算数据集中NA值的数量?

时间:2015-03-16 10:55:24

标签: r

如何知道数据集中有多少个NA值?或者,如果数据集中有任何NA和NaN?

2 个答案:

答案 0 :(得分:4)

这也可以正常使用

sum(is.na(df)) #  For entire dataset

表示数据集中的特定列

sum(is.na(df$col1)) 

或者检查@nicola

提到的所有列
colSums(is.na(df))

答案 1 :(得分:2)

正如 @Roland 注意到,在R中有多个查找和处理缺失值的函数(参见help("NA")here)。

示例:

创建一个包含NA

的虚假数据集。

data <- matrix(1:300,,3)
data[sample(300, 40)] <- NA

检查是否有任何缺失值:

anyNA(data)

逐列检查是否有任何缺失值:

apply(data, 2, anyNA)

检查列中缺失值的百分比和计数:

colMeans(is.na(data))*100
colSums(is.na(data))