基础R中是否有包含缺失值的数据集示例?我一直在查看每一个,并且到目前为止还使用google搜索。
library(MASS)
data()
编辑:我知道如何在R中的数据集中添加缺失值,我只想知道是否存在任何此类数据集。
答案 0 :(得分:14)
airquality
在基础中并且其中包含一些NA
> summary(airquality)
Ozone Solar.R Wind Temp Month Day
Min. : 1.00 Min. : 7.0 Min. : 1.700 Min. :56.00 Min. :5.000 Min. : 1.0
1st Qu.: 18.00 1st Qu.:115.8 1st Qu.: 7.400 1st Qu.:72.00 1st Qu.:6.000 1st Qu.: 8.0
Median : 31.50 Median :205.0 Median : 9.700 Median :79.00 Median :7.000 Median :16.0
Mean : 42.13 Mean :185.9 Mean : 9.958 Mean :77.88 Mean :6.993 Mean :15.8
3rd Qu.: 63.25 3rd Qu.:258.8 3rd Qu.:11.500 3rd Qu.:85.00 3rd Qu.:8.000 3rd Qu.:23.0
Max. :168.00 Max. :334.0 Max. :20.700 Max. :97.00 Max. :9.000 Max. :31.0
NA's :37 NA's :7
答案 1 :(得分:1)
VIM包中有一些很好的数据集示例,缺少数据。当我教导缺失值插补时,我使用该包中的睡眠数据集。
答案 2 :(得分:1)
我会用NA创建我自己的数值数据集。以下是创建名为 df 的10x10 data.frame的一种方法,并将80以上的值替换为NA。
df <- data.frame(matrix(data = sample(100,100,replace=TRUE), ncol = 10))
df[df>80] <- NA
奖励,然后您可以使用 visdat 包视觉检查NA。
library(visdat)
vis_miss(df)