我在java中看过其他帖子,但是遗憾的是,我只知道R
我希望获得标签中包含的所有内容(标签,属性,值),包括子标签的内容。我以为我可以做像
这样的事情a = xpathSApply(html, "//span[@class = 'class name']/node()", ????)
但后来我意识到我不知道任何能够获得你道路的全部内容的函数,而不仅仅是属性或只是文本。我该怎么做?
答案 0 :(得分:0)
不确定这是否适用于您的用例,但您是否尝试使用库xml2?
content <- read_xml( html )
nodes <- xml_find_all(content, xpath) # or xml_find_one if you want only the first result
从那里,你可以使用xml_text()
,xml_attrs()
,xml_name()
,xml_children()
,...
要真正检索完整的内容,我会猜测a <- paste(nodes[[1]])
......