我正在尝试从XML中提取某些xml值。因为我只对某些节点感兴趣,所以我正在创建子集。我对R和编程也很陌生
library(XML)
files <- list.files("foldername", full.names = T)
doc <- XML::xmlParse(files[1])
class(doc)
#for instance to get a date value from a node
nodes <- getNodeSet(doc, "//d1:Nodea/d1:Nodeb/d1:Nodec/d1:Date", c(d1 = "schemaLocation") )
但是,还有包含和xsi:type属性的节点如何从子节点获取值,例如Date?代码示例如下所示。由于隐私原因,我无法提供确切的副本。
<cdm:nodea>
<cdm:nodeb xsi:type="cdm:subject">
<cdm:Date>jjjj-mm-dd</cdm:beginDatum>
<cdm:eindDatum>2015-10-17T21:30:00</cdm:eindDatum>
<cdm:locatieGebruiken>
<cdm:voorvalLocatieGebruik>
<cdm:locatie>
<cdm:locatieID>VL2459913_1</cdm:locatieID>
</cdm:locatie>
我听说的一种解决方案是从节点集中创建一个字符串,并通过grepl获取所需的所有信息。