获取R包所需的外部数据的最佳方法

时间:2014-08-30 19:24:42

标签: r cran

我有一个R package来预测性别的性别。为此,它需要几个较大的数据集。我把它们放到了separate R package。理想情况下,gender包可能依赖于genderdata包,并且两者都将被CRAN接受。但是看起来CRAN不会使用genderdata包,因为它太大了(26MB)。 (我猜“大数据”> = 5MB。)

所以我的问题是:如果我无法在gender genderdata中添加Imports:包,那么将这些数据导入我的DESCRIPTION包的最佳方式是什么?文件。

我的想法是依赖devtools并提供这样的函数:

install_gender_data <- function() {
  if(!require(genderdata)) devtools::install_github("lmullen/gender-data-pkg")
}

然后我会使用.onLoad()和一个包启动消息来告诉用户如果他们还没有加载genderdata就运行该功能。

1 个答案:

答案 0 :(得分:-1)

查看Hadley Wickham的'babynames'套餐。 http://cran.r-project.org/web/packages/babynames/index.html