基数R中的数据集具有缺失值

时间:2015-08-06 15:06:51

标签: r missing-data

基础R中是否有包含缺失值的数据集示例?我一直在查看每一个,并且到目前为止还使用google搜索。

library(MASS)
data()

编辑:我知道如何在R中的数据集中添加缺失值,我只想知道是否存在任何此类数据集。

3 个答案:

答案 0 :(得分:14)

airquality在基础中并且其中包含一些NA

> summary(airquality)
     Ozone           Solar.R           Wind             Temp           Month            Day      
 Min.   :  1.00   Min.   :  7.0   Min.   : 1.700   Min.   :56.00   Min.   :5.000   Min.   : 1.0  
 1st Qu.: 18.00   1st Qu.:115.8   1st Qu.: 7.400   1st Qu.:72.00   1st Qu.:6.000   1st Qu.: 8.0  
 Median : 31.50   Median :205.0   Median : 9.700   Median :79.00   Median :7.000   Median :16.0  
 Mean   : 42.13   Mean   :185.9   Mean   : 9.958   Mean   :77.88   Mean   :6.993   Mean   :15.8  
 3rd Qu.: 63.25   3rd Qu.:258.8   3rd Qu.:11.500   3rd Qu.:85.00   3rd Qu.:8.000   3rd Qu.:23.0  
 Max.   :168.00   Max.   :334.0   Max.   :20.700   Max.   :97.00   Max.   :9.000   Max.   :31.0  
 NA's   :37       NA's   :7                                                                      

答案 1 :(得分:1)

VIM包中有一些很好的数据集示例,缺少数据。当我教导缺失值插补时,我使用该包中的睡眠数据集。

答案 2 :(得分:1)

我会用NA创建我自己的数值数据集。以下是创建名为 df 的10x10 data.frame的一种方法,并将80以上的值替换为NA。

df <- data.frame(matrix(data = sample(100,100,replace=TRUE), ncol = 10))
df[df>80] <- NA

奖励,然后您可以使用 visdat 包视觉检查NA。

library(visdat)
vis_miss(df)