在R中保存多个Html源

时间:2017-08-14 17:46:43

标签: r rvest

我创建了以下代码

library('XML')
library('rvest')

links <- c('https://www.google.com/', 
           'https://www.youtube.com/?gl=US', 
           'https://news.google.com/news/u/0/headlines?hl=en&ned=us')

for (i in 1:3){
  html_object <- read_html(links[i])
  write_xml(html_object, file="test.html")
}

我想将所有这些文件保存为html文件,但我目前的代码只保存一个。我猜它在这个例子中不断重写同一个文件3次。我怎么做它不会重写同一个文件?理想情况下,我希望这些html文件的文件名是他们的url链接,但我无法弄清楚如何使用多个链接。例如,我的最终结果应该是三个标题为“https://google.com/”,“https://www.youtube.com/?gl=US”和“https://news.google.come/news/u/0/headlines?h1-en&ned=us”的HTML文件。

1 个答案:

答案 0 :(得分:1)

使用paste0()在for循环中创建文件名怎么样?

for(i in 1:length(links)){
  html_object  <- read_html(links[i])
  somefilename <- paste0("filename_", i, ".html")
  write_xml(html_object, file = somefilename)
}