我有以下XML文档:
<samlp:LogoutRequest ID="123456789" Version="2.0" IssueInstant="200904051217">
<saml:NameID>@NOT_USED@</saml:NameID>
<samlp:SessionIndex>abcdefg</samlp:SessionIndex>
</samlp:LogoutRequest>
我想从中获取SessionIndex
(即'abcdefg')的内容。我试过这个:
XPATH_QUERY = "LogoutRequest[@ID][@Version='2.0'][IssueInstant]/SessionIndex"
SAML_XMLNS = 'urn:oasis:names:tc:SAML:2.0:assertion'
SAMLP_XMLNS = 'urn:oasis:names:tc:SAML:2.0:protocol'
require 'nokogiri'
doc = Nokogiri::XML(xml)
doc.xpath(XPATH_QUERY, 'saml' => SAML_XMLNS, 'samlp' => SAMLP_XMLNS)
但我收到以下错误:
Nokogiri::XML::SyntaxError: Namespace prefix samlp on LogoutRequest is not defined
Nokogiri::XML::SyntaxError: Namespace prefix saml on NameID is not defined
Nokogiri::XML::SyntaxError: Namespace prefix samlp on SessionIndex is not defined
我尝试将命名空间添加到XPath查询中,但这不会改变任何内容。
为什么我不能说服Nokogiri命名空间有效?
答案 0 :(得分:9)
我为您看到两种不同的选择:
删除所有名称空间
蛮力的做法。可能导致存在命名空间冲突的问题。
使用collect_namespaces
更好的解决方案。 你可以使用它一次来识别命名空间(例如在irb中)并对它们进行硬编码。
OR
在运行时使用它,并将其作为https://www.rubydoc.info/github/sparklemotion/nokogiri/Nokogiri/XML/Searchable#xpath-instance_method
答案 1 :(得分:6)
看起来这个文档中的命名空间没有被正确声明 - 根节点上应该有xmlns:samlp
和xmlns:saml
属性。在这种情况下,Nokogiri基本上忽略了名称空间(因为它不能将它们映射到URI或URN),因此如果删除它们,XPath就可以工作,即
doc.xpath(XPATH_QUERY)