Question

我在java中看过其他帖子，但是遗憾的是，我只知道R

我希望获得标签中包含的所有内容（标签，属性，值），包括子标签的内容。我以为我可以做像

这样的事情

a = xpathSApply(html, "//span[@class = 'class name']/node()", ????)

但后来我意识到我不知道任何能够获得你道路的全部内容的函数，而不仅仅是属性或只是文本。我该怎么做？

Answer 1

不确定这是否适用于您的用例，但您是否尝试使用库xml2？

content <- read_xml( html )
nodes <- xml_find_all(content, xpath)   # or xml_find_one if you want only the first result

从那里，你可以使用xml_text()，xml_attrs()，xml_name()，xml_children()，...

来做各种事情。

要真正检索完整的内容，我会猜测a <- paste(nodes[[1]]) ......