R - 从URL / HTML对象/ HTML响应中编写HTML文件

时间:2016-06-04 14:11:46

标签: web rvest httr

我想使用来自R的URL保存HTML文件。 我已尝试在网站的网址上分别使用GETread_htmlhttrrvest个软件包的功能后保存响应对象,我想要保存HTML。但这并不能保存网站的实际内容。

url = "https://facebook.com"
get_object = httr::GET(url); save(get_object, "file.html")
html_object = rvest::read_html(url); save(html_object, "file.html")

这些都不能保存HTML文件中实际网站的正确输出(即.html文件中网页的HTML内容)。

1 个答案:

答案 0 :(得分:5)

使用str(object)找出您正在使用的内容。在这两种情况下,您都试图将非文本写入文本文件。

以下是如何获取文本并使用两个库编写文本...

url = "https://facebook.com"

library(httr)
get_object = GET(url)
cat(content(get_object, "text"), file="temp.html")

library(rvest)
html_object = read_html(url)
write_xml(html_object, file="temp.html")