我创建了以下代码
library('XML')
library('rvest')
links <- c('https://www.google.com/',
'https://www.youtube.com/?gl=US',
'https://news.google.com/news/u/0/headlines?hl=en&ned=us')
for (i in 1:3){
html_object <- read_html(links[i])
write_xml(html_object, file="test.html")
}
我想将所有这些文件保存为html文件,但我目前的代码只保存一个。我猜它在这个例子中不断重写同一个文件3次。我怎么做它不会重写同一个文件?理想情况下,我希望这些html文件的文件名是他们的url链接,但我无法弄清楚如何使用多个链接。例如,我的最终结果应该是三个标题为“https://google.com/”,“https://www.youtube.com/?gl=US”和“https://news.google.come/news/u/0/headlines?h1-en&ned=us”的HTML文件。
答案 0 :(得分:1)
使用paste0()
在for循环中创建文件名怎么样?
for(i in 1:length(links)){
html_object <- read_html(links[i])
somefilename <- paste0("filename_", i, ".html")
write_xml(html_object, file = somefilename)
}