鉴于XML文件,我想提取其相应的XML标记。例如,如果您考虑以下XML文件:
<a> <b> </b> </a> <c> </c>
我想提取a,b,c? 我该如何在R中做到这一点? 我尝试使用this帖子,但对此事没有多大帮助。
答案 0 :(得分:0)
library(XML)
text <- "<a> <b> </b> </a> <c> </c>"
xml <- xmlParseString(text)
a <- getNodeSet(xml,"//a")
# [[1]]
# <a>
# <b> </b>
# </a>
#
# attr(,"class")
# [1] "XMLNodeSet"