我正在寻找附加到R包的标准数据集,该数据集可用于测试代码。我通常使用iris
或mtcars
,但是它们只有一个因子变量,没有缺失值。对于具有多个因子变量和NA的数据包/数据集有何建议,或者对包含的R数据集进行特定条件搜索的方法?
答案 0 :(得分:3)
这是一种搜索包装数据集所需特性的编程方式:
available_datasets <- data(package='datasets')[['results']][, 3];
meets_reqs <- function(datasets) {
sapply(datasets, function(ds) {
dat <- get(sub(" .*", "", ds))
hasfactors <- "factor" %in% sapply(dat, class)
nas <- anyNA(dat)
hasfactors && nas
})
}
res <- meets_reqs(available_datasets)
res[1:3]
# AirPassengers BJsales BJsales.lead (BJsales)
# FALSE FALSE FALSE
res[res]
# attenu
# TRUE