如何找到具有因子和NA的R数据集

时间:2019-03-22 20:01:54

标签: r

我正在寻找附加到R包的标准数据集,该数据集可用于测试代码。我通常使用irismtcars,但是它们只有一个因子变量,没有缺失值。对于具有多个因子变量和NA的数据包/数据集有何建议,或者对包含的R数据集进行特定条件搜索的方法?

1 个答案:

答案 0 :(得分:3)

这是一种搜索包装数据集所需特性的编程方式:

available_datasets <- data(package='datasets')[['results']][, 3];

meets_reqs <- function(datasets) {
    sapply(datasets, function(ds) {
        dat <- get(sub(" .*", "", ds))
        hasfactors <- "factor" %in% sapply(dat, class)
        nas <- anyNA(dat)
        hasfactors && nas
    })
}

res <- meets_reqs(available_datasets)

res[1:3]
# AirPassengers                BJsales BJsales.lead (BJsales) 
#         FALSE                  FALSE                  FALSE 

res[res]
# attenu
#   TRUE