我的问题与“How can I get the values of attributes with namespace, using Nokogiri?”不同。
我的XML包含带有命名空间的属性。如何使用Nokogiri的namespaceB:attributeNameA="attributeAValue"
方法查询包含attributeNameA的元素与namespaceB(css
)?
这是我的代码:
xmlContent = %Q|
<?xml version="1.0"?>
<ns1:el1 xmlns:ns1="blabla" >
<ns1:el2 ns1:att="123">with namespace</ns1:el2 >
<ns1:el2 att="noNameSpace">no namespace</ns1:el2 >
</ns1:el1>|
xml_doc = Nokogiri::XML(xmlContent)
#no namespace
result = xml_doc.css('ns1|el2[att]')
result.each {|i| puts i}
#with namespace
result = xml_doc.css('ns1|el2[ns1|att]') #error unexpexted '|'
result.each {|i| puts i}
2011年1月6日编辑: 从这个链接: https://github.com/tenderlove/nokogiri/issues/257#issuecomment-3365636 Nokogiri不支持直接使用namespaced属性查询xml元素。
真正的用例是修改SSIS包(* .dtsx);我无法使用属性DTS查询所有元素:名称包含“projectVar _”。
我必须通知nokogiri团队这个用例。
答案 0 :(得分:1)
当您解析文档时,Nokogiri正试图理解它并且无法理解命名空间声明:
puts xml_doc.errors
返回:
[#<Nokogiri::XML::SyntaxError: XML declaration allowed only at the start of the document>]
这是因为XML DECL:
<?xml version="1.0"?>
删除它可以解决这个问题。
您访问节点属性的方式也不正确:
result = xml_doc.css('ns1|el2[att]')
result.each {|i| puts i}
应该是:
result = xml_doc.css('ns1|el2')
result.each { |i| puts i['att'] }
尝试使用命名空间访问命名空间节点的属性是奇怪的。我不记得曾经看到过命名空间属性。 Nokogiri似乎也不喜欢它:
如果我这样做:
require 'nokogiri'
xmlContent = %Q|
<ns1:el1 xmlns:ns1="blabla">
<ns1:el2 ns1:att="123">with namespace</ns1:el2 >
<ns1:el2 att="noNameSpace">no namespace</ns1:el2 >
</ns1:el1>|
xml_doc = Nokogiri::XML(xmlContent)
puts xml_doc.errors
puts "Searching for: 'att' attribute"
result = xml_doc.css('ns1|el2')
result.each { |i| puts i['att'] }
puts "Searching for: 'ns1|att' attribute"
result = xml_doc.css('ns1|el2')
result.each { |i| puts i['ns1|att'] }
我明白了:
Searching for: 'att' attribute
123
noNameSpace
Searching for: 'ns1|att' attribute
result.first # => #<Nokogiri::XML::Element:0x8051e19c name="el2" namespace=#<Nokogiri::XML::Namespace:0x8051f344 prefix="ns1" href="blabla"> attributes=[#<Nokogiri::XML::Attr:0x8051e084 name="att" namespace=#<Nokogiri::XML::Namespace:0x8051f344 prefix="ns1" href="blabla"> value="123">] children=[#<Nokogiri::XML::Text:0x80519e30 "with namespace">]>
result.first.keys # => ["att"]
result.first.values # => ["123"]
result.first['att'] # => "123"
result.first['ns1|att'] # => nil
result.first['ns1:att'] # => nil
result.last # => #<Nokogiri::XML::Element:0x8051356c name="el2" namespace=#<Nokogiri::XML::Namespace:0x8051f344 prefix="ns1" href="blabla"> attributes=[#<Nokogiri::XML::Attr:0x805133a0 name="att" value="noNameSpace">] children=[#<Nokogiri::XML::Text:0x805122d4 "no namespace">]>
result.last.keys # => ["att"]
result.last.values # => ["noNameSpace"]
result.last['att'] # => "noNameSpace"
result.last['ns1|att'] # => nil
result.last['ns1:att'] # => nil