R中的download.file包括先决条件

时间:2015-11-13 02:42:44

标签: r wget

我正在尝试使用download.file来获取一些网页,包括嵌入的图片等。我认为使用wget它相当于-p -k选项,但我看不到如何这样做......

如果我这样做:

download.file("http://guardian.co.uk","test.html")

这显然有效,但我收到了这个错误:

Warning messages:
1: running command 'wget -p -k "http://guardian.co.uk" -O "test.html"' had status 1 
2: In download.file("http://guardian.co.uk", "test.html", method = "wget",  :
  download had nonzero exit status

当我跑步时:

download.file("http://guardian.co.uk","test.html", method = "wget", extra = "-p -k") #no recursion (-r), but get pre-requisites, and (-k) convert for local viewing

我已完成Sys.which("wget")&路径已设置(我不会尝试访问我认为会导致问题的https)。

一旦我完成了这个,我实际上想把它放到一个循环中,我下载一组网址(和它们的嵌入内容)来创建一个单独的html输出......

1 个答案:

答案 0 :(得分:0)

简单的解决方案,只需使用system直接致电wget

system("wget http://guardian.co.uk -p -k")

我认为问题在于传递输出文件(' test.html')意味着指定了-O选项,因此您无法调用-r -k而调用wget直接表示它会单独保存文件。