使用C#中的LINQ对XML文档中的元素进行分组和排序

时间:2016-02-18 14:42:32

标签: c# xml linq xslt

假设我有以下XML文件,基本上是从各种来源合并的随机培训课程列表:

<?xml version="1.0" encoding="utf-8"?>
<Courses>
  <Course>
    <Name>Big Data Advanced - Spark</Name>
    <Track>Big Data</Track>
    <Code>BD-102</Code>
  </Course>
  <Course>
    <Name>Big Data Advanced - YARN</Name>
    <Track>Big Data</Track>
    <Code>BD-102</Code>
  </Course>
  <Course>
    <Name>Big Data Basics</Name>
    <Track>Big Data</Track>
    <Code>BD-101</Code>
  </Course>
  <Course>
    <Name>DI Administration</Name>
    <Track>Data Integration</Track>
    <Code>DI-103</Code>
  </Course>
  <Course>
    <Name>DI Advanced</Name>
    <Track>Data Integration</Track>
    <Code>DI-102</Code>
  </Course>
  <Course>
    <Name>DI Basics</Name>
    <Track>Data Integration</Track>
    <Code>DI-101</Code>
  </Course>
</Courses>

我想按照Track节点的值对这些课程进行分组,然后按每个轨道内的Code进行排序。预期结果是:

<?xml version="1.0" encoding="utf-8"?>
<Courses>
  <Track name="Big Data">
    <Course>
      <Name>Big Data Basics</Name>
      <Track>Big Data</Track>
      <Code>BD-101</Code>
    </Course>
    <Course>
      <Name>Big Data Advanced - Spark</Name>
      <Track>Big Data</Track>
      <Code>BD-102</Code>
    </Course>
    <Course>
      <Name>Big Data Advanced - YARN</Name>
      <Track>Big Data</Track>
      <Code>BD-102</Code>
    </Course>
  </Track>
  <Track name="Data Integration">
    <Course>
      <Name>DI Basics</Name>
      <Track>Data Integration</Track>
      <Code>DI-101</Code>
    </Course>
    <Course>
      <Name>DI Advanced</Name>
      <Track>Data Integration</Track>
      <Code>DI-102</Code>
    </Course>
    <Course>
      <Name>DI Administration</Name>
      <Track>Data Integration</Track>
      <Code>DI-103</Code>
    </Course>
  </Track>
</Courses>

我知道如何使用XSLT转换实现此结果。然而,我最近发现了LINQ之美,并且希望通过一个优雅的查询来做同样的事情。我尝试合并How do I order a Group result, in Linq?Group by in LINQ中的答案中的表达式,但我不完全理解new部分。大多数情况下,我最终会得到错误的语法,根本不会产生错误或没有结果。

例如:

// Sort by Course Code and group by Track
var doc = XDocument.Load("all-courses.xml");
var query = doc.Root.Elements("Course")
    .GroupBy(c => c.Element("Track").Value)
    .Select(o => new { Track = o.Key, Courses = o.OrderBy(c => c.Element("Code").Value).ToList() }).ToList();

我错过了什么/做错了什么?

2 个答案:

答案 0 :(得分:2)

new { ...}创建一个匿名类型,这不是您想要的最终结果。在您的情况下,您希望将数据转换回XML。这意味着您应该从现有的XML对象中创建新的XML对象。以下是如何执行此操作的示例:

var doc = XDocument.Load("all-courses.xml");

var elements = doc.Root.Elements("Course")
    .GroupBy(c => c.Element("Track").Value)
    .Select(o =>
        new XElement(
            "Track",
            o.OrderBy(c => c.Element("Code").Value),
            new XAttribute("name", o.Key)));

var new_doc = new XDocument(new XElement("Courses", elements));

new_doc.Save("result.xml");

答案 1 :(得分:1)

同意@YacoubMassad的解决方案,我只想添加你也可以传递属性和Track var query = xDoc.Root.Elements("Course") .GroupBy(c => c.Element("Track").Value) .Select(g=>new XElement("Track",new XAttribute("name",g.Key),g.OrderBy(c => c.Element("Code").Value))); xDoc.Root.ReplaceNodes(query); 元素中的嵌套元素:

[mygroup]
redis1 ansible_host=192.168.0.1 slave_host=192.168.0.3
redis2 ansible_host=192.168.0.2 slave_host=192.168.0.1
redis3 ansible_host=192.168.0.3 slave_host=192.168.0.2