如何在c#中读取非结构化的xml

时间:2014-08-17 06:36:19

标签: c# xml

我想阅读非结构化的XML。子元素的数量可以增加或减少。在C#中读取此类XML的最佳方法是什么?示例XML如下所示

<?xml version="1.0" encoding="UTF-8"?>
<entities>
    <entity>
        <type>Organization</type>
        <relevance>0.918192</relevance>
        <sentiment>
            <type>neutral</type>
        </sentiment>
        <count>1</count>
        <text>Wheelers Hill Secondary College Deb Ball</text>
    </entity>
    <entity>
        <type>Organization</type>
        <relevance>0.621802</relevance>
        <sentiment>
            <type>positive</type>
            <score>0.789945</score>
        </sentiment>
        <count>1</count>
        <text>Greensborough College</text>
        <disambiguated>
            <name>Greensborough College</name>
            <subType>School</subType>
            <website>http://www.greensc.vic.edu.au/</website>
            <dbpedia>http://dbpedia.org/resource/Greensborough_College
            </dbpedia>
            <freebase>http://rdf.freebase.com/ns/m.0bp2jy</freebase>
        </disambiguated>
    </entity>
</entities>

1 个答案:

答案 0 :(得分:2)

在C#中读取XML的最佳方法是使用LINQ。您可以使用以下代码查询XML并获取所需的元素。

首先创建一个扩展方法来检查元素是否存在并返回其值

public static string CheckAndGetElementValue(this XElement parent, string elementName, string defaultValue = null) 
{
    var el = parent.Element(elementName);
    if(el != null)
    {
         return el.Value;
    }
    else
    {
         return defaultValue;
    }
}

在获取元素值时使用扩展方法:

XDocument xDoc = XDocument.Load("filename");
var listitems = (from el in xDoc.Descendants("entities")
                where el.Element("entity").CheckAndGetElementValue("type") == "Organization"
                select el);