选择具有特定命名空间属性的元

时间:2011-11-04 18:06:33

标签: ruby xml nokogiri xml-namespaces inkscape

我的问题是关于我解析一个Inkscape(XML)文件的一些问题,但它的解决方案应该适用于任何XML文档,所以我觉得它与Stackoverflow相关。

我正在尝试使用Nokogiri CSS选择器来获取具有属性<g>的所有inkscape:groupmode="layer"元素。但冒号导致错误:

Nokogiri::CSS::SyntaxError: unexpected ':' after 'inkscape'

我的XML文档如下:

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<!-- Created with Inkscape (http://www.inkscape.org/) -->
<svg xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:cc="http://creativecommons.org/ns#" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:svg="http://www.w3.org/2000/svg" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:sodipodi="http://sodipodi.sourceforge.net/DTD/sodipodi-0.dtd" xmlns:inkscape="http://www.inkscape.org/namespaces/inkscape" width="744.09448819" height="1052.3622047" id="svg3720" version="1.1" inkscape:version="0.48.1 r9760" sodipodi:docname="test.svg">
  <defs id="defs3722">
    <inkscape:perspective sodipodi:type="inkscape:persp3d" inkscape:vp_x="0 : 526.18109 : 1" inkscape:vp_y="0 : 1000 : 0" inkscape:vp_z="744.09448 : 526.18109 : 1" inkscape:persp3d-origin="372.04724 : 350.78739 : 1" id="perspective3728"/>
  </defs>
  <sodipodi:namedview id="base" pagecolor="#ffffff" bordercolor="#666666" borderopacity="1.0" inkscape:pageopacity="0.0" inkscape:pageshadow="2" inkscape:zoom="0.35" inkscape:cx="375" inkscape:cy="634.28571" inkscape:document-units="px" inkscape:current-layer="g2818" showgrid="false" inkscape:window-width="550" inkscape:window-height="483" inkscape:window-x="66" inkscape:window-y="471" inkscape:window-maximized="0"/>
  <metadata id="metadata3725">
    <rdf:RDF>
      <cc:Work rdf:about="">
        <dc:format>image/svg+xml</dc:format>
        <dc:type rdf:resource="http://purl.org/dc/dcmitype/StillImage"/>
        <dc:title/>
      </cc:Work>
    </rdf:RDF>
  </metadata>
  <g inkscape:label="Layer 1" inkscape:groupmode="layer" id="layer1">
    <rect style="fill:#d2e149;fill-opacity:1;stroke:none" id="rect2812" width="211.42857" height="128.57143" x="168.57143" y="215.21933" ry="64.285713"/>
  </g>
  <g inkscape:label="Layer 1 copy copy" inkscape:groupmode="layer" id="g2818">
    <rect style="fill:#d2e149;fill-opacity:1;stroke:none" id="rect2820" width="211.42857" height="128.57143" x="145.71428" y="615.2193" ry="64.285713"/>
  </g>
</svg>

我的选择器如下:

nokogiri_document.css('[inkscape:groupmode="layer"]').to_html

我也尝试用管道替换冒号

如何编写CSS选择器以处理inkscape:groupmode属性...或者任何foo:bar属性?

2 个答案:

答案 0 :(得分:3)

使用XPath,指定g元素的命名空间。由于您的根元素声明xmlns:svg与新的默认命名空间(xmlns)相同,因此您可以使用svg作为前缀:

require 'nokogiri'
doc = Nokogiri.XML(IO.read('contents.xml'))
layers = doc.xpath('//svg:g[@inkscape:groupmode="layer"]')

p layers.map{ |layer| layer['id'] }
#=> ["layer1", "g2818"]

解码,上面的XPath说:

  • // - 在文档的任何级别
  • svg:g - ...找到名称与g命名空间匹配的svg元素
  • […] - ...但仅在符合此项内容的情况下
  • @inkscape:groupmode - ...有一个名为@的属性(groupmode),其命名空间与inkscape匹配
  • ="layer" - 此属性的内在价值为文字layer

或者,如果您只是尝试读取此文件(而不是操作并重新保存它),您可以使用删除所有命名空间的粗略但简化的黑客。在这种情况下,您的原始代码可以正常工作:

doc.remove_namespaces!
p doc.css('g[groupmode="layer"]').map{ |g| g['id'] }
#=> ["layer1", "g2818"]

答案 1 :(得分:1)

我建议您尝试使用XPath。看看这个片段:

require 'nokogiri'
doc = Nokogiri::XML(File.read('your_file.xml'))
doc.xpath('//xmlns:g[starts-with(@inkscape:label, "Layer")]').size  # => 2

请注意XPath表达式中的xmlns。因为XPath查询查找不在任何名称空间中的元素,所以您需要告诉XPath处理器您正在查找给定名称空间中的元素。你可以通过几种方式来做到这一点。我使用最简单的情况 - 在XPath查询中使用默认命名空间。您还可以在XPath方法调用的第二个参数中定义自定义命名空间,并在查询中使用该命名空间。