在大型.NET字符串中计算换行符的最快方法是什么?

时间:2010-03-31 22:43:27

标签: c# .net

有没有办法改善这个:

private static int CountNewlines(string s)
{
    int len = s.Length;
    int c = 0;
    for (int i=0; i < len;  i++)
    {
        if (s[i] == '\n') c++;
    }
    return c;
}

我特别关注字符串上的Item访问器。不确定它是否只是像C / C ++这样的指针算法。

6 个答案:

答案 0 :(得分:20)

我测试了这些实现

private static int Count1(string s)
{
    int len = s.Length;
    int c = 0;
    for (int i=0; i < len;  i++)
    {
        if (s[i] == '\n') c++;
    }
    return c+1;
}

private static int Count2(string s)
{
    int count = -1;
    int index = -1;

    do
    {
        count++;
        index = s.IndexOf('\n', index + 1);
    }
    while (index != -1);

    return count+1;
}

private static int Count3(string s)
{
    return s.Count( c => c == '\n' ) + 1;
}


private static int Count4(string s)
{
    int n = 0;
    foreach( var c in s )
    {
        if ( c == '\n' ) n++;
    }
    return n+1;
}

private static int Count5(string s)
{
    var a = s.ToCharArray();
    int c = 0;
    for (int i=0; i < a.Length; i++)
    {
        if (a[i]=='\n') c++;
    }
    return c+1;
}

这是我在~25k字符串上进行100000次迭代的时序结果。越低越快。

              Time  Factor
Count1   4.8581503     1.4
Count2   4.1406059     1.2
Count3  45.3614124    13.4
Count4   3.3896130     1.0
Count5   5.9304543     1.7

令人惊讶的是,对我来说,Enumerator实现对我来说是最快的,在很大程度上 - 比下一个最接近的实现快20%。无论方法的运行顺序如何,结果都是可重复的。我还使用了一个预热阶段来确保瞬态效应(jit等)被考虑在内。

这是针对发布版本(/ optimize +)

答案 1 :(得分:6)

我很确定这不会比将字符串转换为字节并检查它们的速度慢得多,如果不是更快的话。 String类应该高度优化。

如果这是一个大字符串,那么多个线程的并行执行可能会让事情变得更快: - )

答案 2 :(得分:4)

这可能是最有效的选项 - 项目访问者在内部进行了优化,您可以将其视为执行指针算术。

答案 3 :(得分:2)

好吧,String实现IEnumerable<char>,所以我肯定会尝试:

s.Count( c => c == '\n' )

这看起来很好,原始方法快30倍:)

我还没有放弃IEnumerable,所以我也尝试过:

int n = 0;
foreach( var c in s )
{
    if ( c == '\n' ) n++;
}
return n;

这似乎和原始方法一样快。

答案 4 :(得分:0)

你可以使用“ToCharArray();”将字符串转换为char数组但我不认为它会改善性能..你可以尝试使用不安全的代码(指针),而不是因为它有其缺点。

答案 5 :(得分:0)

如果你要在循环中使用它,请将它设为实例方法。