说我要下载r-Bloggers.com页面。 如果我在Chrome中按Ctrl + S,将下载一个html文件以及一个包含58个文件(.css,.js,图片等)的文件夹
我想在R中做同样的事情。
我找到了答案并将其包装到system()
:system("wget --page-requisites https://www.r-bloggers.com/")
没有给我58 + 1个文件。
相同于:
download.file(url = "https://www.r-bloggers.com/",
destfile = "try", mode = "wget", extra = "--page-requisites")
download.file(url = "https://www.r-bloggers.com/",
destfile = "try.html", mode = "wget", extra = "--page-requisites")
答案 0 :(得分:2)
这是因为默认情况下,Wget只会尝试从同一域下载项目。但是,此网站从不同的主机加载所有内容。
您需要使用--span-hosts
标志来允许Wget访问来自不同主机的文件