删除数据框中的N.A值

时间:2014-12-17 21:51:47

标签: r

我是R的初级用户,我正在使用名为rere.csv的csv存档,因此尝试使用此代码获取质量列的平均值:

x<-read.csv("rere.csv", header = TRUE, sep = ";")

mean(x$quality)

但我明白了:

  

警告消息:在mean.default(x $ quality)中:参数不是   数字或逻辑:返回NA

quality
5
6
2
2
4
9
41
1
5
N.A
2
23
2
9
5
62
2

2 个答案:

答案 0 :(得分:3)

试试这个:

x<-read.csv("rere.csv", header = TRUE, sep = ";", na.strings = "N.A")

mean(x$quality, na.rm = TRUE)

您可以阅读帮助页?read.csv以获取有关参数的更多信息,包括na.strings

答案 1 :(得分:1)

您的数据看起来有N.A个缺失值条目。默认情况下,R期望NA,但您可以告诉read.csv N.A缺少数据

x <- read.csv("rere.csv", header = TRUE, sep = ";", na.strings = "N.A")

这将允许R将列作为具有缺失值的数字而不是因子(分类)变量读取。要获得非缺失值的平均值,您必须告诉mean忽略NA。

mean(x$quality, na.rm = TRUE)