我正在尝试使用download.file来获取一些网页,包括嵌入的图片等。我认为使用wget
它相当于-p -k
选项,但我看不到如何这样做......
如果我这样做:
download.file("http://guardian.co.uk","test.html")
这显然有效,但我收到了这个错误:
Warning messages:
1: running command 'wget -p -k "http://guardian.co.uk" -O "test.html"' had status 1
2: In download.file("http://guardian.co.uk", "test.html", method = "wget", :
download had nonzero exit status
当我跑步时:
download.file("http://guardian.co.uk","test.html", method = "wget", extra = "-p -k") #no recursion (-r), but get pre-requisites, and (-k) convert for local viewing
我已完成Sys.which("wget")
&路径已设置(我不会尝试访问我认为会导致问题的https)。
一旦我完成了这个,我实际上想把它放到一个循环中,我下载一组网址(和它们的嵌入内容)来创建一个单独的html输出......
答案 0 :(得分:0)
简单的解决方案,只需使用system
直接致电wget
:
system("wget http://guardian.co.uk -p -k")
我认为问题在于传递输出文件(' test.html')意味着指定了-O
选项,因此您无法调用-r -k
而调用wget
直接表示它会单独保存文件。