我是R的初级用户,我正在使用名为rere.csv的csv存档,因此尝试使用此代码获取质量列的平均值:
x<-read.csv("rere.csv", header = TRUE, sep = ";")
mean(x$quality)
但我明白了:
警告消息:在mean.default(x $ quality)中:参数不是 数字或逻辑:返回NA
quality
5
6
2
2
4
9
41
1
5
N.A
2
23
2
9
5
62
2
答案 0 :(得分:3)
试试这个:
x<-read.csv("rere.csv", header = TRUE, sep = ";", na.strings = "N.A")
mean(x$quality, na.rm = TRUE)
您可以阅读帮助页?read.csv
以获取有关参数的更多信息,包括na.strings
。
答案 1 :(得分:1)
您的数据看起来有N.A
个缺失值条目。默认情况下,R期望NA
,但您可以告诉read.csv
N.A
缺少数据
x <- read.csv("rere.csv", header = TRUE, sep = ";", na.strings = "N.A")
这将允许R将列作为具有缺失值的数字而不是因子(分类)变量读取。要获得非缺失值的平均值,您必须告诉mean
忽略NA。
mean(x$quality, na.rm = TRUE)