如何在我的GitHub存储库中包含完整的R发行版

时间:2017-03-07 17:58:28

标签: r github

我为各种政府机构建立了运输模型。我的模型是通过GitHub管理的,它依赖于R来执行某些计算。我目前在存储库中有整个 r安装文件夹。这可能不是正确的解决方案,但这是我的一些约束:

  • 我的客户通常都是不那么精明的程序员。当他们下载/克隆模型时,它只需要工作。
  • 这需要在10年后的情况下 - 无论R的当前版本和所有软件包依赖项是什么。

将整个R文件夹放在repo中解决了这两个问题,但创建了一些新问题:

  • 存储库比需要的时间大得多/下载时间更长。
  • 如果传输模型更新为新版本(比如v2.0),我想将R及其软件包更新到最新版本。我担心这会进一步增加回购的规模。

我理解的一个解决方案是子模块。我可以将完整的R文件夹放在一个单独的仓库中,并将其作为子模块引入。这至少可以清理模型库。

压缩R文件夹怎么样?一些早期测试显示git可以区分zip文件,但我不知道它是作为平面文件还是读取内容。另外,GitHub会抱怨100MB + zip文件吗?如果可以,我想避免GitLFS,但要求我的客户解压缩该文件不会有问题。

我也看过packrat,但据我所知,这只适用于R项目。

最后,我并不完全理解makefile / recipes,但如果有一个我可以运行的脚本可以下载特定版本的R及其库,那就太好了。一个复杂的问题是一些R包是私有的GitHub存储库。

无论如何,如果需要,我很乐意提供更多信息。谢谢你的帮助!

0 个答案:

没有答案