使用Ruby / Nokogiri

时间:2018-05-18 03:49:57

标签: ruby xml parsing nokogiri

我正在尝试从以下xml文件中获取值,但是因为我没有得到输出而我被卡住了。可能有人可以帮我这个。

我目前的代码是:

require 'nokogiri'

doc = Nokogiri.XML(xml)

d=doc.xpath("//NtrkData/Rutins//GT_Nmbbrs/RngeDat")
puts d.xpath("//EE").text + "-" + d.xpath("//PR").text + "-" + d.xpath("//Brng").text + "-" + d.xpath("//Erng").text

我收到了这个输出

3Z94PL-45156-73359-86353

但我想得到的是元素EE,PR,Brng(如果存在)和Erng(如果存在)的值。所有4个值都在同一行。

因此,对于以下xml,我正在寻找的输出是:

3Z9 45 
4PL 156 73359 86353

xml是:

xml =<<_
<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<main>
<Oganin>
    <Oganna>EJ-MKKL</Oganna>
    <CutryI>YUFG</CutryI>
    <Ntwl>
    <Ntrk>
        <TGCo>KOLPWE</TGCo>
        <NtrkType>Uymmls</NtrkType>
        <NtrkData>
        <Rutins>
            <Rutinf>
            <CTT>
                <GT_Nmbbrs>
                <RngeDat>
                    <Nmbbr>
                    <EE>3Z9</EE>
                    <PR>45</PR>
                    </Nmbbr>
                </RngeDat>
                <RngeDat>
                    <Nmbbr>
                    <EE>4PL</EE>
                    <PR>156</PR>
                    <Srng>
                        <Brng>73359</Brng>
                        <Erng>86353</Erng>
                    </Srng>
                    </Nmbbr>
                </RngeDat>
                </GT_Nmbbrs>
            </CTT>              
            </Rutinf>
        </Rutins>
        </NtrkData>
    </Ntrk>
    </Ntwl>
</Oganin>
</main>
_

1 个答案:

答案 0 :(得分:2)

Nokogiri有一个完美的文档,它明确指出Nokogiri::XML::NodeSet#inner_text没有达到预期的效果。相反,它连接文本节点值

此外,没有办法像文档中所建议的那样map(&:text),因为您可能希望保留<Srng>个孩子的归属感,这在批量查询中显然是不可能的。

那就是说,你需要查询各自的父母并重复孩子:

d.xpath('//Nmbbr').
  map do |node|
    [
      node.xpath("./EE"),
      node.xpath("./PR"),
      node.xpath("./Srng").map do |node|
         %w[Brng Erng].map { |path| node.xpath("./#{path}") }
      end
    ]
  end.
  map { |nodes| nodes.flatten.map(&:text) }
  #⇒ [["3Z9", "45"], ["4PL", "156", "73359", "86353"]]

现在迭代结果并根据需要打印。