使用docker文件安装R软件包

时间:2017-07-24 20:46:20

标签: r docker dockerfile yum install.packages

我在docker文件中使用以下行安装了R.请建议如何指定现在要在我的docker文件中安装的软件包。

RUN yum -y install R-core R-devel

我做这样的事情:

RUN R -e "install.packages('methods',dependencies=TRUE, repos='http://cran.rstudio.com/')"\
    && R -e "install.packages('jsonlite',dependencies=TRUE, repos='http://cran.rstudio.com/')" \
    && R -e "install.packages('tseries',dependencies=TRUE, repos='http://cran.rstudio.com/')" 

这是正确的方法吗?

6 个答案:

答案 0 :(得分:6)

是的,您的解决方案应该有效。我遇到了同样的问题,并在此处找到了解决方案https://github.com/glamp/r-docker/blob/master/Dockerfile

简而言之,请使用:RUN Rscript -e "install.packages('PACKAGENAME')"。我已经尝试过它并且有效。

答案 1 :(得分:5)

如@Cameron Kerr的评论所建议,Rscript不会给您带来构建失败。 到目前为止,推荐的方法是按照问题的建议进行操作。

RUN R -e "install.packages('methods',dependencies=TRUE, repos='http://cran.rstudio.com/')"
RUN R -e "install.packages('jsonlite',dependencies=TRUE, repos='http://cran.rstudio.com/')"
RUN R -e "install.packages('tseries',dependencies=TRUE, repos='http://cran.rstudio.com/')" 

如果您确定没有包装失败,请使用这种单线-

RUN R -e "install.packages(c('methods', 'jsonlite', 'tseries'),
                           dependencies=TRUE, 
                           repos='http://cran.rstudio.com/')"

编辑:如果您不使用Base-R图像,则可以使用rocker-org的{​​{1}}或r-ver或{{ 1}}张图片。这是repo。这是一个示例Dockerfile-

r-studio

tidyverse标志是可选的,如果软件包安装失败(这将导致FROM rocker/tidyverse:latest # Install R packages RUN install2.r --error \ methods \ jsonlite \ tseries 命令失败),它将使--error引发错误。默认情况下,install.packages()仅引发警告,这意味着即使Dockerfile安装失败,它也可以成功构建。

所有docker build基本上都是install install.packages()包,用于rocker-org功能

答案 2 :(得分:1)

当软件包安装失败时,R -e "install.packages..."方法并不总是产生错误。

我根据Cameron Kerr的回答here编写了一个脚本,如果无法加载该软件包,则会产生错误,并中断Docker构建过程。它可以从R软件包库,GitHub或给定完整URL的源安装软件包。它还会打印安装时间,以帮助计划在一个命令中将哪些软件包组合在一起。

Dockerfile中的用法示例:

# Install from CRAN repo:
RUN Rscript install_packages_or_die.R https://cran.rstudio.com/ Cairo
RUN Rscript install_packages_or_die.R Cairo # Uses default CRAN repo
RUN Rscript install_packages_or_die.R jpeg png tiff # Multiple packages

# Install from GitHub:
RUN Rscript install_packages_or_die.R github ramnathv/htmlwidgets
RUN Rscript install_packages_or_die.R github timelyportfolio/htmlwidgets_spin spin

# Install from source given full URL of package:
RUN Rscript install_packages_or_die.R https://cran.r-project.org/src/contrib/Archive/curl/curl_4.0.tar.gz curl

这是脚本:

#!/usr/bin/env Rscript

# Install R packages or fail with error.
#
# Arguments:
#   - First argument (optional) can be one of:
#       1. repo URL
#       2. "github" if installing from GitHub repo (requires that package 'devtools' is
#          already installed)
#       3. full URL of package from which to install from source; if used, provide package
#          name in second argument (e.g. 'curl')
#     If this argument is omitted, the default repo https://cran.rstudio.com/ is used.
#   - Remaining arguments are either:
#       1. one or more R package names, or
#       2. if installing from GitHub, the path containing username and repo name, e.g.
#          'timelyportfolio/htmlwidgets_spin', optionally followed by the package name (if
#          it differs from the GitHub repo name, e.g. 'spin').

arg_list = commandArgs(trailingOnly=TRUE)

if (length(arg_list) < 1) {
  print("ERROR: Too few arguments.")
  quit(status=1, save='no')
}

if (arg_list[1] == 'github' || grepl("^https?://", arg_list[1], perl=TRUE)) {
  if (length(arg_list) == 1) {
    print("ERROR: No package name provided.")
    quit(status=1, save='no')
  }
  repo = arg_list[1]
  packages = arg_list[-1]
} else {
  repo = 'https://cran.rstudio.com/'
  packages = arg_list
}

for(i in seq_along(packages)){
    p = packages[i]

    start_time <- Sys.time()
    if (grepl("^https?://[A-Za-z0-9.-]+/.+\\.tar\\.gz$", repo, perl=TRUE)) {
      # If 'repo' is URL with path after domain name, treat it as full path to a package
      # to be installed from source.
      install.packages(repo, repo=NULL, type="source");
    } else if (repo == "github") {
      # Install from GitHub.
      github_path = p
      elems = strsplit(github_path, '/')
      if (lengths(elems) != 2) {
        print("ERROR: Invalid GitHub path.")
        quit(status=1, save='no')
      }
      username = elems[[1]][1]
      github_repo_name = elems[[1]][2]
      if (!is.na(packages[i+1])) {
        # Optional additional argument was given specifying the R package name.
        p = packages[i+1]
      } else {
        # Assume R package name is the same as GitHub repo name.
        p = github_repo_name
      }

      library(devtools)
      install_github(github_path)
    } else {
      # Install from R package repository.
      install.packages(p, dependencies=TRUE, repos=repo);
    }
    end_time <- Sys.time()

    if ( ! library(p, character.only=TRUE, logical.return=TRUE) ) {
      quit(status=1, save='no')
    } else {
      cat(paste0("Time to install ", p, ":\n"))
      print(end_time - start_time)
    }

    if (repo == "github") {
      break
    }
}

答案 3 :(得分:1)

这很丑,但很管用 - 请参阅下面的真实世界示例,了解为什么值得这样做。

# install packages and check installation success, install.packages itself does not report fails
RUN R -e "install.packages('RMySQL');     if (!library(RMySQL, logical.return=T)) quit(status=10)" \
 && R -e "install.packages('devtools');   if (!library(devtools, logical.return=T)) quit(status=10)" \
 && R -e "install.packages('data.table'); if (!library(data.table, logical.return=T)) quit(status=10)" \
 && R -e "install.packages('purrr');      if (!library(purrr, logical.return=T)) quit(status=10)" \
 && R -e "install.packages('tidyr');      if (!library(tidyr, logical.return=T)) quit(status=10)"

真实示例:devtools 安装开始失败,因为它突然需要 libgit2-devinstall.packages() 打印信息性信息。关于失败,但没有非零退出代码,只会随着 docker build 的继续而滚动。

答案 4 :(得分:0)

您可以使用所需的安装命令编写R脚本,然后使用Docker运行它 - 如果我正确阅读此文档(https://hub.docker.com/_/r-base/)。

ref

FROM r-base COPY . /usr/local/src/myscripts WORKDIR /usr/local/src/myscripts CMD ["Rscript", "myscript.R"] Build your image with the command: $ docker build -t myscript /path/to/Dockerfile 包含相应的软件包安装命令。

答案 5 :(得分:0)

我想推荐 rocker/tidyverse 映像,您可以在其上安装其他软件包,如下所示:

RUN R -e "install.packages('bigrquery',dependencies=TRUE, repos='http://cran.rstudio.com/')"

从 r-base 进行相同的安装后,Rserve 出现了问题,该问题可能已预安装在 r-base 映像中。我在关于 r-base 的页面上没有找到任何相关信息,所以我不推荐 r-base 作为一个简单的解决方案。

R 包的安装也可以用 apt-get install r-cran-* 来完成,但是 Rocker/tidyverse 的维护者不推荐在这个特定的镜像中使用它,因为这会导致安装另一个 R 版本。但是,您可能会检查它并发现它适合您的任务。