在C#中,删除字符串[]或List <string>中的空白条目的最快方法是什么?</string>

时间:2012-02-15 17:33:58

标签: c# arrays linq

我有非常大的字符串列表和数组,我发现了2个我想要解决的问题:

  1. 删除所有空白字符串
  2. 删除所有只有空格的条目
  3. 这些可以是2种不同的解决方案。 。不确定与基本循环或此相比是否有更快的方法:

    array = array.Where(r=>!String.IsNullOrEmpty(r.Trim());
    

5 个答案:

答案 0 :(得分:16)

对于List<T>,有一个可能 - 等效的,它会就地执行删除RemoveAll

// We can do better than this - see below...
list.RemoveAll(r => String.IsNullOrEmpty(r.Trim()));

这个可能在如何执行列表重新定位方面更快。

当然,这还取决于您是否想要就地删除。就个人而言,我通常更喜欢LINQ方法,因为它现在更灵活,更惯用 - 我通常集合视为不可变序列,即使它们不是真的:)

需要注意的一点是:您不需要修剪字符串以查明它是否有任何空格。您可以使用string.IsNullOrWhiteSpace,这应该被称为IsNullOrEmptyOrWhitespace - 基本上“它没有内容”。

这很容易对性能产生非常显着的差异 - 如果你有很多长字符串,那么O(N)操作(Trim)就没有意义了确定有一些内容...当你再次扔掉它时,没有必要创建一个新的字符串。

注意:尺寸从早期版本改变,以便在最后三个案例之间进行良好区分......

以下是一个例子:

using System;
using System.Collections.Generic;
using System.Diagnostics;
using System.Linq;

public class Test
{
    static void Main()
    {
        List<string> list = new List<string>();
        string longString = new string('x', 1000) + " ";
        for (int i = 0; i < 1000000; i++)
        {
            list.Add(i % 100 == 0 ? "" : longString);
        }

        Stopwatch sw = Stopwatch.StartNew();
        list.Where(r=> !string.IsNullOrEmpty(r.Trim())).ToList();
        sw.Stop();
        Console.WriteLine("IsNullOrEmpty(Trim): {0}", sw.ElapsedMilliseconds);

        GC.Collect();

        sw = Stopwatch.StartNew();
        list.Where(r=> !string.IsNullOrWhiteSpace(r)).ToList();
        sw.Stop();
        Console.WriteLine("IsNullOrWhitespace: {0}", sw.ElapsedMilliseconds);

        GC.Collect();

        sw = Stopwatch.StartNew();
        List<string> listResult = new List<string>();
        int countList = list.Count;
        for (int i = 0; i < countList; i++)
        {
            string item = list[i];
            if (!string.IsNullOrWhiteSpace(item))
            {
                listResult.Add(item);
            }
        }
        sw.Stop();
        Console.WriteLine("New list: {0}", sw.ElapsedMilliseconds);

        GC.Collect();

        // This has to be last, as it modifies in-place 
        sw = Stopwatch.StartNew();
        list.RemoveAll(r => string.IsNullOrWhiteSpace(r));
        sw.Stop();
        Console.WriteLine("List.RemoveAll: {0}", sw.ElapsedMilliseconds);
    }        
}

我的笔记本电脑上的示例结果:

IsNullOrEmpty(Trim): 3573
IsNullOrWhitespace: 452
New list: 232
List.RemoveAll: 153

答案 1 :(得分:5)

经典for/foreach总是比任何Linq对象表达式快,因为Linq在场景后使用for/ForEach

答案 2 :(得分:5)

唯一想到的是使用IsNullOrWhitespace方法。

array = array.Where(r=>!String.IsNullOrWhitespace(r));

我怀疑你会发现任何速度差异。这是微优化的一个极端例子。

答案 3 :(得分:4)

您可以使用

array = array.Where(r=>!String.IsNullOrWhiteSpace(r));

如果您有List<string>

list.RemoveAll(str => string.IsNullOrWhiteSpace(str));

答案 4 :(得分:0)

正如预期的那样,经典for比任何LINQ解决方案都要快

static void Main(string[] args)
    {


        List<string> list = new List<string>();
        string longString = new string('x', 10000) + " ";
        for (int i = 0; i < 1000000; i++)
        {
            list.Add(i % 100 == 0 ? "" : longString);
        }

        Stopwatch sw = Stopwatch.StartNew();
        list.Where(r => !string.IsNullOrEmpty(r.Trim())).ToList();
        sw.Stop();
        Console.WriteLine("IsNullOrEmpty(Trim): {0}", sw.ElapsedMilliseconds);

        GC.Collect();

        sw = Stopwatch.StartNew();
        list.Where(r => !string.IsNullOrWhiteSpace(r)).ToList();
        sw.Stop();
        Console.WriteLine("IsNullOrWhitespace: {0}", sw.ElapsedMilliseconds);


        GC.Collect();


        sw = Stopwatch.StartNew();
        //this is result list
        List<string> listResult = new List<string>();
        int countList = list.Count;
        for (int i = 0; i < countList; i++)
        {
            string item = list[i];
            if (!string.IsNullOrWhiteSpace(item))
            {
                listResult.Add(item);
            }
        }
        sw.Stop();
        Console.WriteLine("Classic for + IsNullOrWhitespace: {0}", sw.ElapsedMilliseconds);

        GC.Collect();

        sw = Stopwatch.StartNew();
        list.AsParallel().Where(r => !string.IsNullOrWhiteSpace(r)).ToList();
        sw.Stop();
        Console.WriteLine("PLINQ IsNullOrWhitespace: {0}", sw.ElapsedMilliseconds);

        Console.Read();
    }

在我的机器上(i5)

IsNullOrEmpty(Trim): 6165
IsNullOrWhitespace: 39
Classic for + IsNullOrWhitespace 21
PLINQ IsNullOrWhitespace: 65