XML - 解析R(xml2)中的选择性节点

时间:2016-10-31 04:57:25

标签: r xml xml2

我有一个XML输入文件。该文件包含某些事务的数据。 XML文件如下所示:

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<Message xmlns:bs="urn:iso:std:iso:20022:tech:xsd:camt.053.001.02"
         xmlns="urn:bcsis" 
         xmlns:head="urn:iso:std:iso:20022:tech:xsd:head.001.001.01">
<bs:stmt>
  <bs:Bal>
    <bs:Tp>
      <bs:CdOrPrtry>
        <bs:Prtry>Outward</bs:Prtry>
      </bs:CdOrPrtry>
    </bs:Tp>
    <bs:Amt Ccy="USD">300.00</bs:Amt>
    <bs:CdtDbtInd>DBIT</bs:CdtDbtInd>
    <bs:Dt>
      <bs:Dt>2016-10-04</bs:Dt>
    </bs:Dt>
  </bs:Bal>
  <bs:Ntry>
    <bs:Amt Ccy="USD">300.00</bs:Amt>
  </bs:Ntry>
</bs:stmt>
<bs:stmt>
  <bs:Bal>
    <bs:Tp>
      <bs:CdOrPrtry>
        <bs:Prtry>Inward</bs:Prtry>
      </bs:CdOrPrtry>
    </bs:Tp>
    <bs:Amt Ccy="USD">250.00</bs:Amt>
    <bs:CdtDbtInd>DBIT</bs:CdtDbtInd>
    <bs:Dt>
      <bs:Dt>2016-10-04</bs:Dt>
    </bs:Dt>
  </bs:Bal>
  <bs:Ntry>
    <bs:Amt Ccy="USD">250.00</bs:Amt>
  </bs:Ntry>
</bs:stmt>
</Message>

我需要提取交易类型(bs:Prtry)为“Outward”的交易金额。

这是我到目前为止所做的:

library(xml2)
library(XML)
library(dplyr)

d <- read_xml("~/CEED/sample1.dat") # read the file
in_out <- xml_find_all(d, ".//bs:stmt/bs:Bal/bs:Tp/bs:CdOrPrtry/bs:Prtry") # Transaction Type
out_txns <- in_out[which(in_out %>% xml_text() == "Outward")] # Select only Outward

这是我下一步要做的事情:

  • 导航到out_txns
  • 中的bs:stmt标记
  • 找到bs:Ntry,bs:Amt标签并提取值

我尝试过一些事情(xml_find_parents),但无法找到正确的方法

1 个答案:

答案 0 :(得分:2)

你的方法是在正确的轨道上,但你想要做的太快了。

第一步是找到所有节点,然后将它们保存为节点向量in_out变量。然后解析并过滤&#34; Outward&#34;来自&#34; in_out&#34;的请求子集要创建out_txns的节点向量。从这个减少的节点列表中,提取所请求的&#34;数量&#34;信息。

library(xml2)
d<-read_xml("~/CEED/sample1.dat") # read the file

#find all of the stmt nodes
in_out <- xml_find_all(d, ".//bs:stmt") # Transaction Type

#filter the nodes and Select only Outward
out_txns <- in_out[xml_text(xml_find_first(in_out, ".//bs:Prtry")) == "Outward"] 
#Extract the amounts from the remianing nodes
amount<-xml_text(xml_find_first(out_txns, ".//bs:Amt"))