LINQ to XML - 获取给定的XElement文本内容,不包含子元素的文本内容

时间:2012-04-24 16:35:48

标签: linq-to-xml

我刚刚开始使用LINQ to XML,但我无法获取给定XElement的文本内容,也没有获取所有子元素的文本内容。

例如,如果我有以下XML文档:

<?xml version="1.0" encoding="utf-8" ?>
<root xmlns="example.org/rootns">This is root value
    <children>
        <child name='child 1'>value 1</child>
        <child name='child 2'>value 2
            <grandchild name='grandchild A'>value A</grandchild>
        </child>
    </children>
</root>

我使用以下测试方法:

private static void Test()
{
    string xString = @"<?xml version=""1.0"" encoding=""utf-8"" ?><root xmlns=""example.org/rootns"">This is root value<children><child name='child 1'>value 1</child><child name='child 2'>value 2<grandchild name='grandchild A'>value A</grandchild></child></children></root>";

    var xDoc = XDocument.Parse(xString);

    XNamespace ns = @"example.org/rootns";
    string elemName = "child";

    var xElems = from e in xDoc.Descendants(ns + elemName)
                 select e;

    foreach (var xElem in xElems)
    {
        Console.WriteLine(xElem.Value);
    }
}

然后我在输出上得到两行:

    value 1
    value 2value A

第一行显示第一个孩子的内容 - 这没关系。然而,第二行不仅显示了第一个孩子的文本内容,还显示了该孩子的任何后代。

如何在没有孙子文字内容的情况下获得第二个孩子的文字内容?

另请注意,示例只是一个简单的示例来说明我在做什么,在生产中我不一定知道调用子元素是什么(如果有的话),但我应该能够获得我需要的元素从中获取文本内容。


Jon Skeet的回答有助于解决方案。只需用以下内容替换foreach循环,即可选择文本XNode而不是XElement的值:

...
foreach (var xElem in xElems)
{
    var values = from n in xElem.Nodes()
                 where n.NodeType == System.Xml.XmlNodeType.Text
                 select n;

    if (values != null && values.Count() > 0)
        Console.WriteLine(values.First());
}

1 个答案:

答案 0 :(得分:6)

如果有多个文本节点,您想要做什么?例如,您可以将它们全部加在一起:

var text = string.Join("", element.Nodes.OfType<XText>().Select(x => x.Value));

编辑:如果你只想要一个元素,那么它比你所展示的更容易:

var textNode = xElem.Nodes.OfType<XText>().FirstOrDefault();
if (textNode != null)
{
    Console.WriteLine(textNode.Value);
}