可以在"之间获取文本。 "来自一个属性

时间:2018-01-30 02:22:25

标签: r regex rselenium

我可以在"之间获取文字吗? "使用RSelenium?

<note day="12" month="11" year="2002"
to="Tove" from="Jani" heading="Reminder"
body="Don't forget me this weekend!">
</note>

例如:&#34; 12&#34;从day属性或&#34; 11&#34;来自月份属性。

谢谢!

1 个答案:

答案 0 :(得分:1)

RSelenium更像是一种从动态网站获取内容的工具。您可以使用rvest解析内容。

要获取所有属性,请使用xml_attrs()。假设您的XML保存到名为“mydata.xml”的文件中:

library(rvest)
read_xml("mydata.xml") %>% 
  xml_nodes(xpath = "//note") %>% 
  xml_attrs()

[[1]]
                            day                           month                            year 
                           "12"                            "11"                          "2002" 
                             to                            from                         heading 
                         "Tove"                          "Jani"                      "Reminder" 
                           body 
"Don't forget me this weekend!" 

xml_attr()用于个别属性:

read_xml("mydata.xml") %>% 
  xml_nodes(xpath = "//note") %>% 
  xml_attr("day")

[1] "12"