R节点{xml_nodeset}到xml或html

时间:2018-02-15 21:30:45

标签: html r xml-parsing rvest xml2

接受rvest / require(xml2); require(rvest) doc = read_html('https://www.w3.org/TR/html4/intro/intro.html') e = html_node(doc, '.subtoc') 生成的任何假设节点,例如:

e

有没有办法将xml2::write_html(e, 'e.html') head(readLines('e.html')) [1] "<div class=\"subtoc\">" [2] "<p><strong>Contents</strong></p>" [3] "" [4] "<ol>" [5] "<li>" [6] "<a class=\"tocxref\" href=\"#h-2.1\">What is the World Wide Web?</a> " 转换回html?我能做的最接近的事情是:

row

1 个答案:

答案 0 :(得分:0)

您可以尝试将节点转换为字符,然后重复read_html代码。

newdoc <-read_html(as.character(e))

write_html(newdoc, e.html)

这将创建一个可读的html文档。