我看到许多使用RCurl下载二进制文件的例子都是这样的:
library("RCurl")
curl = getCurlHandle()
bfile=getBinaryURL (
"http://www.example.com/bfile.zip",
curl= curl,
progressfunction = function(down, up) {print(down)}, noprogress = FALSE
)
writeBin(bfile, "bfile.zip")
rm(curl, bfile)
如果下载非常大,我想最好将它同时写入存储介质,而不是全部内存。
在RCurl文档中,有一些示例可以通过块获取文件并在下载时对其进行操作,但它们似乎都是指文本块。
你能给出一个有效的例子吗?
用户建议将R本机download file
与mode = 'wb'
选项一起用于二进制文件。
在许多情况下,本机函数是一种可行的替代方案,但是有许多用例不适合这种本机函数(https,cookie,表单等),这就是RCurl存在的原因。
答案 0 :(得分:17)
这是工作示例:
library(RCurl)
#
f = CFILE("bfile.zip", mode="wb")
curlPerform(url = "http://www.example.com/bfile.zip", writedata = f@ref)
close(f)
它将直接下载到文件。返回的值将是(而不是下载的数据)请求的状态(如果没有错误,则为0)。
提及CFILE
对RCurl手册有点简洁。希望将来它将包含更多细节/示例。
为方便起见,相同的代码被打包为一个函数(并带有一个进度条):
bdown=function(url, file){
library('RCurl')
f = CFILE(file, mode="wb")
a = curlPerform(url = url, writedata = f@ref, noprogress=FALSE)
close(f)
return(a)
}
## ...and now just give remote and local paths
ret = bdown("http://www.example.com/bfile.zip", "path/to/bfile.zip")
答案 1 :(得分:2)
嗯..使用mode ='wb':) ..运行这个并跟随我的评论。
# create a temporary file and a temporary directory on your local disk
tf <- tempfile()
td <- tempdir()
# run the download file function, download as binary.. save the result to the temporary file
download.file(
"http://sourceforge.net/projects/peazip/files/4.8/peazip_portable-4.8.WINDOWS.zip/download",
tf ,
mode = 'wb'
)
# unzip the files to the temporary directory
files <- unzip( tf , exdir = td )
# here are your files
files