如何通过XPath检索CDATA标记内的元素文本?

时间:2009-02-20 04:51:26

标签: xpath

考虑以下xml片段:

<Obj>
   <Name><![CDATA[SomeText]]></Name>
</Obj>

如何通过XPath检索“SomeText”值?我正在使用Nauman Leghari(优秀)Visual XPath tool /Obj/Name返回元素
/Obj/Name/text()返回空白

我不认为这个工具有问题(我可能错了) - 我也读过XPath无法提取CDATA(请参阅最后的回复in this thread) - 这对我来说听起来有点奇怪。

5 个答案:

答案 0 :(得分:20)

/Obj/Name/text()是返回CDATA标记内容的XPath。

让我失望的是Value属性的行为。对于XMLNode(DOM世界),Element的XmlNode.Value属性(带有CDATA或其他)返回Null。 InnerText属性将为您提供CDATA / Text内容。 如果使用Xml.Linq,则XElement.Value将返回CDATA内容。

string sXml = @"
<object>
    <name><![CDATA[SomeText]]></name>
    <name>OtherName</name>
</object>";

XmlDocument xmlDoc = new XmlDocument();
xmlDoc.LoadXml( sXml );
XmlNamespaceManager nsMgr = new XmlNamespaceManager(xmlDoc.NameTable);

Console.WriteLine(@"XPath = /object/name" );
WriteNodesToConsole(xmlDoc.SelectNodes("/object/name", nsMgr));

Console.WriteLine(@"XPath = /object/name/text()" );
WriteNodesToConsole( xmlDoc.SelectNodes("/object/name/text()", nsMgr) );

Console.WriteLine(@"Xml.Linq = obRoot.Elements(""name"")");
XElement obRoot = XElement.Parse( sXml );
WriteNodesToConsole( obRoot.Elements("name") );

输出:

XPath = /object/name
        NodeType = Element
        Value = <null>
        OuterXml = <name><![CDATA[SomeText]]></name>
        InnerXml = <![CDATA[SomeText]]>
        InnerText = SomeText

        NodeType = Element
        Value = <null>
        OuterXml = <name>OtherName</name>
        InnerXml = OtherName
        InnerText = OtherName

XPath = /object/name/text()
        NodeType = CDATA
        Value = SomeText
        OuterXml = <![CDATA[SomeText]]>
        InnerXml =
        InnerText = SomeText

        NodeType = Text
        Value = OtherName
        OuterXml = OtherName
        InnerXml =
        InnerText = OtherName

Xml.Linq = obRoot.Elements("name")
        Value = SomeText
        Value = OtherName

原来,Visual XPath的作者有一个CDATA类型的XmlNodes的TODO。一个小代码片段,我现在有CDATA支持。 alt text

MainForm.cs

private void Xml2Tree( TreeNode tNode, XmlNode xNode)
{
   ...
   case XmlNodeType.CDATA:
      //MessageBox.Show("TODO: XmlNodeType.CDATA");
      // Gishu                    
      TreeNode cdataNode = new TreeNode("![CDATA[" + xNode.Value + "]]");
      cdataNode.ForeColor = Color.Blue;
      cdataNode.NodeFont = new Font("Tahoma", 12);
      tNode.Nodes.Add(cdataNode);
      //Gishu
      break;

答案 1 :(得分:10)

CDATA部分只是XPath被称为text nodethe XML Infoset中的“字符信息项块”的一部分。

显然,您的工具错误。其他工具,the XPath Visualizer在评估此XPath表达式时正确突出显示Name元素的文本:

/*/Name/text()

还可以编写一个简单的XSLT转换

<xsl:stylesheet version="1.0"
 xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
 <xsl:output method="text"/>
<xsl:template match="/">
  "<xsl:value-of select="/*/Name"/>"
</xsl:template>
</xsl:stylesheet>

在提供的XML文档上应用此转换时

<Obj>
    <Name><![CDATA[SomeText]]></Name>
</Obj>

产生了正确的结果:

  "SomeText"

答案 2 :(得分:8)

我认为您引用的线程表示CDATH忽略了CDATA标记本身,而不是CDATA标记中包含的文本。

我的猜测是该工具存在问题,源代码可供下载,也许您可​​以调试它......

答案 3 :(得分:3)

看看这是否有帮助 - http://www.zrinity.com/xml/xpath/
XPATH = / Obj / Name / text()

答案 4 :(得分:-3)

建议使用cdata的md5哈希的另一个字段。然后,您可以使用xpath基于md5进行查询,没有问题

<sites>
  <site>
    <name>Google</name>
    <url><![CDATA[http://www.google.com]]></url>
    <urlMD5>ed646a3334ca891fd3467db131372140</urlMD5>
  </site>
</sites>

然后你可以搜索:

/sites/site[urlMD5=ed646a3334ca891fd3467db131372140]