R-IMDb数据集未加载

时间:2019-09-05 19:52:11

标签: r readr

我正在尝试编写一个函数,该函数将从以下位置的IMDb数据集页面下载和加载文件:https://datasets.imdbws.com/

问题是函数执行正在下载文件,但将其加载到任何对象。

我创建了单独的步骤代码,效果很好。

url <- "https://datasets.imdbws.com/name.basics.tsv.gz"
tmp <- tempfile()
download.file(url, tmp)

name_basics <- readr::read_tsv(
  file = gzfile(tmp),
  col_names = TRUE, 
  quote = "",
  na = "\\N",
  progress = FALSE
)

文件已下载并加载到name_basics。 但是,当我尝试创建功能代码时,则没有数据加载。 我做错了什么?

功能代码

imdbTSVfiles <- function(fileName){
  url <- paste0("https://datasets.imdbws.com/",fileName,".tsv.gz")
  tmp <- tempfile()
  download.file(url, tmp)

  name <- readr::read_tsv(
      file = gzfile(tmp),
      col_names = TRUE,
      quote = "",
      na = "\\N")
}

imdbTSVfiles("name.basics")

预期结果:下载并加载了提供的文件名。

1 个答案:

答案 0 :(得分:0)

您需要将数据存储到动态命名变量,可以使用assign()轻松实现。

imdbTSVfiles <- function(fileName){
  url <- paste0("https://datasets.imdbws.com/",fileName,".tsv.gz")
  tmp <- tempfile()
  download.file(url, tmp)

  assign(fileName,
         readr::read_tsv(
           file = gzfile(tmp),
           col_names = TRUE,
           quote = "",
           na = "\\N"),
  envir = .GlobalEnv)
}

imdbTSVfiles("name.basics")

这应该将数据存储在name.basics变量中。