我的问题是关于我解析一个Inkscape(XML)文件的一些问题,但它的解决方案应该适用于任何XML文档,所以我觉得它与Stackoverflow相关。
我正在尝试使用Nokogiri CSS选择器来获取具有属性<g>
的所有inkscape:groupmode="layer"
元素。但冒号导致错误:
Nokogiri::CSS::SyntaxError: unexpected ':' after 'inkscape'
我的XML文档如下:
<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<!-- Created with Inkscape (http://www.inkscape.org/) -->
<svg xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:cc="http://creativecommons.org/ns#" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:svg="http://www.w3.org/2000/svg" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:sodipodi="http://sodipodi.sourceforge.net/DTD/sodipodi-0.dtd" xmlns:inkscape="http://www.inkscape.org/namespaces/inkscape" width="744.09448819" height="1052.3622047" id="svg3720" version="1.1" inkscape:version="0.48.1 r9760" sodipodi:docname="test.svg">
<defs id="defs3722">
<inkscape:perspective sodipodi:type="inkscape:persp3d" inkscape:vp_x="0 : 526.18109 : 1" inkscape:vp_y="0 : 1000 : 0" inkscape:vp_z="744.09448 : 526.18109 : 1" inkscape:persp3d-origin="372.04724 : 350.78739 : 1" id="perspective3728"/>
</defs>
<sodipodi:namedview id="base" pagecolor="#ffffff" bordercolor="#666666" borderopacity="1.0" inkscape:pageopacity="0.0" inkscape:pageshadow="2" inkscape:zoom="0.35" inkscape:cx="375" inkscape:cy="634.28571" inkscape:document-units="px" inkscape:current-layer="g2818" showgrid="false" inkscape:window-width="550" inkscape:window-height="483" inkscape:window-x="66" inkscape:window-y="471" inkscape:window-maximized="0"/>
<metadata id="metadata3725">
<rdf:RDF>
<cc:Work rdf:about="">
<dc:format>image/svg+xml</dc:format>
<dc:type rdf:resource="http://purl.org/dc/dcmitype/StillImage"/>
<dc:title/>
</cc:Work>
</rdf:RDF>
</metadata>
<g inkscape:label="Layer 1" inkscape:groupmode="layer" id="layer1">
<rect style="fill:#d2e149;fill-opacity:1;stroke:none" id="rect2812" width="211.42857" height="128.57143" x="168.57143" y="215.21933" ry="64.285713"/>
</g>
<g inkscape:label="Layer 1 copy copy" inkscape:groupmode="layer" id="g2818">
<rect style="fill:#d2e149;fill-opacity:1;stroke:none" id="rect2820" width="211.42857" height="128.57143" x="145.71428" y="615.2193" ry="64.285713"/>
</g>
</svg>
我的选择器如下:
nokogiri_document.css('[inkscape:groupmode="layer"]').to_html
我也尝试用管道替换冒号
如何编写CSS选择器以处理inkscape:groupmode
属性...或者任何foo:bar
属性?
答案 0 :(得分:3)
使用XPath,指定g
元素的命名空间。由于您的根元素声明xmlns:svg
与新的默认命名空间(xmlns
)相同,因此您可以使用svg
作为前缀:
require 'nokogiri'
doc = Nokogiri.XML(IO.read('contents.xml'))
layers = doc.xpath('//svg:g[@inkscape:groupmode="layer"]')
p layers.map{ |layer| layer['id'] }
#=> ["layer1", "g2818"]
解码,上面的XPath说:
//
- 在文档的任何级别svg:g
- ...找到名称与g
命名空间匹配的svg
元素[…]
- ...但仅在符合此项内容的情况下@inkscape:groupmode
- ...有一个名为@
的属性(groupmode
),其命名空间与inkscape
匹配="layer"
- 此属性的内在价值为文字layer
。或者,如果您只是尝试读取此文件(而不是操作并重新保存它),您可以使用删除所有命名空间的粗略但简化的黑客。在这种情况下,您的原始代码可以正常工作:
doc.remove_namespaces!
p doc.css('g[groupmode="layer"]').map{ |g| g['id'] }
#=> ["layer1", "g2818"]
答案 1 :(得分:1)
我建议您尝试使用XPath。看看这个片段:
require 'nokogiri'
doc = Nokogiri::XML(File.read('your_file.xml'))
doc.xpath('//xmlns:g[starts-with(@inkscape:label, "Layer")]').size # => 2
请注意XPath表达式中的xmlns
。因为XPath查询查找不在任何名称空间中的元素,所以您需要告诉XPath处理器您正在查找给定名称空间中的元素。你可以通过几种方式来做到这一点。我使用最简单的情况 - 在XPath查询中使用默认命名空间。您还可以在XPath方法调用的第二个参数中定义自定义命名空间,并在查询中使用该命名空间。