我有非常大的字符串列表和数组,我发现了2个我想要解决的问题:
这些可以是2种不同的解决方案。 。不确定与基本循环或此相比是否有更快的方法:
array = array.Where(r=>!String.IsNullOrEmpty(r.Trim());
答案 0 :(得分:16)
对于List<T>
,有一个可能 - 等效的,它会就地执行删除RemoveAll
:
// We can do better than this - see below...
list.RemoveAll(r => String.IsNullOrEmpty(r.Trim()));
这个可能在如何执行列表重新定位方面更快。
当然,这还取决于您是否想要就地删除。就个人而言,我通常更喜欢LINQ方法,因为它现在更灵活,更惯用 - 我通常将集合视为不可变序列,即使它们不是真的:)
需要注意的一点是:您不需要修剪字符串以查明它是否有任何空格。您可以使用string.IsNullOrWhiteSpace
,这应该被称为IsNullOrEmptyOrWhitespace
- 基本上“它没有内容”。
这很容易对性能产生非常显着的差异 - 如果你有很多长字符串,那么O(N)操作(Trim
)就没有意义了确定有一些内容...当你再次扔掉它时,没有必要创建一个新的字符串。
注意:尺寸从早期版本改变,以便在最后三个案例之间进行良好区分......
以下是一个例子:
using System;
using System.Collections.Generic;
using System.Diagnostics;
using System.Linq;
public class Test
{
static void Main()
{
List<string> list = new List<string>();
string longString = new string('x', 1000) + " ";
for (int i = 0; i < 1000000; i++)
{
list.Add(i % 100 == 0 ? "" : longString);
}
Stopwatch sw = Stopwatch.StartNew();
list.Where(r=> !string.IsNullOrEmpty(r.Trim())).ToList();
sw.Stop();
Console.WriteLine("IsNullOrEmpty(Trim): {0}", sw.ElapsedMilliseconds);
GC.Collect();
sw = Stopwatch.StartNew();
list.Where(r=> !string.IsNullOrWhiteSpace(r)).ToList();
sw.Stop();
Console.WriteLine("IsNullOrWhitespace: {0}", sw.ElapsedMilliseconds);
GC.Collect();
sw = Stopwatch.StartNew();
List<string> listResult = new List<string>();
int countList = list.Count;
for (int i = 0; i < countList; i++)
{
string item = list[i];
if (!string.IsNullOrWhiteSpace(item))
{
listResult.Add(item);
}
}
sw.Stop();
Console.WriteLine("New list: {0}", sw.ElapsedMilliseconds);
GC.Collect();
// This has to be last, as it modifies in-place
sw = Stopwatch.StartNew();
list.RemoveAll(r => string.IsNullOrWhiteSpace(r));
sw.Stop();
Console.WriteLine("List.RemoveAll: {0}", sw.ElapsedMilliseconds);
}
}
我的笔记本电脑上的示例结果:
IsNullOrEmpty(Trim): 3573
IsNullOrWhitespace: 452
New list: 232
List.RemoveAll: 153
答案 1 :(得分:5)
经典for/foreach
总是比任何Linq
对象表达式快,因为Linq
在场景后使用for/ForEach
。
答案 2 :(得分:5)
唯一想到的是使用IsNullOrWhitespace方法。
array = array.Where(r=>!String.IsNullOrWhitespace(r));
我怀疑你会发现任何速度差异。这是微优化的一个极端例子。
答案 3 :(得分:4)
您可以使用
array = array.Where(r=>!String.IsNullOrWhiteSpace(r));
如果您有List<string>
:
list.RemoveAll(str => string.IsNullOrWhiteSpace(str));
答案 4 :(得分:0)
正如预期的那样,经典for
比任何LINQ解决方案都要快
static void Main(string[] args)
{
List<string> list = new List<string>();
string longString = new string('x', 10000) + " ";
for (int i = 0; i < 1000000; i++)
{
list.Add(i % 100 == 0 ? "" : longString);
}
Stopwatch sw = Stopwatch.StartNew();
list.Where(r => !string.IsNullOrEmpty(r.Trim())).ToList();
sw.Stop();
Console.WriteLine("IsNullOrEmpty(Trim): {0}", sw.ElapsedMilliseconds);
GC.Collect();
sw = Stopwatch.StartNew();
list.Where(r => !string.IsNullOrWhiteSpace(r)).ToList();
sw.Stop();
Console.WriteLine("IsNullOrWhitespace: {0}", sw.ElapsedMilliseconds);
GC.Collect();
sw = Stopwatch.StartNew();
//this is result list
List<string> listResult = new List<string>();
int countList = list.Count;
for (int i = 0; i < countList; i++)
{
string item = list[i];
if (!string.IsNullOrWhiteSpace(item))
{
listResult.Add(item);
}
}
sw.Stop();
Console.WriteLine("Classic for + IsNullOrWhitespace: {0}", sw.ElapsedMilliseconds);
GC.Collect();
sw = Stopwatch.StartNew();
list.AsParallel().Where(r => !string.IsNullOrWhiteSpace(r)).ToList();
sw.Stop();
Console.WriteLine("PLINQ IsNullOrWhitespace: {0}", sw.ElapsedMilliseconds);
Console.Read();
}
在我的机器上(i5)
IsNullOrEmpty(Trim): 6165
IsNullOrWhitespace: 39
Classic for + IsNullOrWhitespace 21
PLINQ IsNullOrWhitespace: 65