List <t> .Sort()vs List <t> .OrderBy()的实用程序,用于自定义容器类的成员</t> </t>

时间:2010-06-16 18:31:34

标签: c# linq sorting list

我发现自己正在运行一些旧的3.5框架遗留代码,并发现了一些必须以同步方式更新的一大堆列表和字典。我已经确定通过将这些过程融合到新的自定义类的自定义容器类中,我可以使这个过程更容易利用和理解。然而,有些观点涉及到通过特定内部属性组织这些新容器类的内容。例如,按一个类的ID号属性排序。

由于容器类主要基于通用List对象,我的第一直觉是使用IComparable编写内部类,并编写比较属性的CompareTo方法。这样,当我想调用排序时,我可以调用items.Sort()

但是,我一直在考虑改用items = items.OrderBy(Func)。这样,如果我需要按任何其他属性排序,它会更灵活。可读性也更好,因为用于排序的属性将与排序调用一起列出,而不是必须查找IComparable代码。因此整体实施感觉更清洁。

我不关心过早或微观优化,但我喜欢一致性。我发现最好在适当的情况下坚持使用一种实现,并在必要时使用不同的实现。是否值得将我的代码转换为使用LINQ OrderBy而不是使用List.Sort?坚持使用这些自定义容器的IComparable实现是一种更好的做法吗?任何一条路径都有重要的机械优势,我应该权衡决策吗?或者它们的最终功能是否等同于它只是变成编码器的偏好?

2 个答案:

答案 0 :(得分:19)

这里的主要观点是List<T>.Sort()进行了排序。如果列表暴露给外部代码,它将始终代表与此代码相同的对象。如果列表通过容器类之外的代码保存在字段中,这一点很重要。如果您使用OrderBy()进行排序,则每次都会获得一个新的枚举,替换之前的items。以前存储的任何列表都不代表您班级的当前状态。

考虑到性能,OrderBy必须遍历整个列表才能对项目进行排序。然后,您将调用ToList()从此枚举中创建新列表,再次遍历列表。另外,由于它是一个枚举,List将使用倍增算法,增加其大小,直到每个元素都适合它。如果是大型列表,则可能会进行相当多的分配和内存复制。我希望性能比List<T>.Sort()差得多。

编辑:小基准:

internal class Program {

    private static List<int> CreateList(int size) {

        // use the same seed so that every list has the same elements
        Random random = new Random(589134554);

        List<int> list = new List<int>(size);
        for (int i = 0; i < size; ++i)
            list.Add(random.Next());
        return list;
    }

    private static void Benchmark(int size, bool output = true) {
        List<int> list1 = CreateList(size);
        List<int> list2 = CreateList(size);

        Stopwatch stopwatch = Stopwatch.StartNew();
        list1.Sort();
        stopwatch.Stop();
        double elapsedSort = stopwatch.Elapsed.TotalMilliseconds;
        if (output)
            Console.WriteLine("List({0}).Sort(): {1}ms (100%)", size, elapsedSort);

        stopwatch.Restart();
        list2.OrderBy(i => i).ToList();
        stopwatch.Stop();
        double elapsedOrderBy = stopwatch.Elapsed.TotalMilliseconds;
        if (output)
            Console.WriteLine("List({0}).OrderBy(): {1}ms ({2:.00%})", size, elapsedOrderBy, elapsedOrderBy / elapsedSort);

    }

    internal static void Main() {

        // ensure linq library is loaded and initialized
        Benchmark(1000, false);

        Benchmark(10);
        Benchmark(100);
        Benchmark(1000);
        Benchmark(10000);
        Benchmark(100000);
        Benchmark(1000000);

        Console.ReadKey();
    }
}

输出(标准化为List.Sort):

List(10).Sort(): 0,0025ms (100%)
List(10).OrderBy(): 0,0157ms (628,00%)
List(100).Sort(): 0,0068ms (100%)
List(100).OrderBy(): 0,0294ms (432,35%)
List(1000).Sort(): 0,0758ms (100%)
List(1000).OrderBy(): 0,3107ms (409,89%)
List(10000).Sort(): 0,8969ms (100%)
List(10000).OrderBy(): 4,0751ms (454,35%)
List(100000).Sort(): 10,8541ms (100%)
List(100000).OrderBy(): 50,3497ms (463,88%)
List(1000000).Sort(): 124,1001ms (100%)
List(1000000).OrderBy(): 705,0707ms (568,15%)

答案 1 :(得分:4)

正如Julien所说,Sort()可能会更快,但是既然你提到了OrderBy()的更好的可读性和灵活性,你也可以使用Sort()方法实现这一点(至少如果你想要的属性)基础你的排序是可比的)

items = items.OrderBy(x => x.Name).ToList();
items.Sort((x,y) => x.Name.CompareTo(y.Name)); // If x.Name is never null
items.Sort((x,y) => String.Compare(x.Name, y.Name)); // null safe