有什么方法可以让这个C#代码更快?

时间:2016-08-30 14:18:31

标签: c# performance x12

我正在读取一个大文件X12并解析其中的信息。我有两个瓶颈功能,似乎无法解决。 read_line()和get_element()有什么方法可以让这两个函数更快? get_element函数的主要瓶颈似乎是Substring方法。

    public String get_element(int element_number) {
        int count = 0;
        int start_index = 0;
        int end_index = 0;
        int current_index = 0;

        while (count < element_number && current_index != -1) {
            current_index = line_text.IndexOf(x12_reader.element_delimiter, start_index);
            start_index = current_index + 1;
            count++;
        }

        if (current_index != -1) {
            end_index = line_text.IndexOf(x12_reader.element_delimiter, start_index);
            if (end_index == -1) end_index = line_text.Length;
            return line_text.Substring(start_index, end_index - start_index);
        } else {
            return "";
        }
    }

    private String read_line() {
        string_builder.Clear();
        int n;
        while ((n = stream_reader.Read()) != -1) {
            if (n == line_terminator) return string_builder.ToString();
            string_builder.Append((char)n);
        }
        return string_builder.ToString();
    }

我正在阅读x12数据。这是一个它看起来像的例子。 http://examples.x12.org/005010X221/dollars-and-data-sent-together/

3 个答案:

答案 0 :(得分:4)

由于您的探查器告诉您get_element是瓶颈,并且方法本身编码效率非常高,因此您需要尽量减少调用此方法的次数。

在循环中反复调用get_element会强制它重复执行相同的解析工作:

for (int i = 0 ; i != n ; i++) {
    var element = get_element(i);
    ... // Do something with the element
}

您应该能够通过将get_element重写为GetElements将所有元素作为集合返回,然后在循环中从同一个集合中获取单个元素来解决此问题:

var allElements = GetElements();
for (int i = 0 ; i != n ; i++) {
    var element = allElements[i];
    ... // Do something with the element
}
  

在大多数情况下,我只需要一个或两个元素

在这种情况下,您可以创建一个方法,一次检索所有必需的索引 - 例如,通过传递所需索引的BitArray

答案 1 :(得分:1)

好的,第二次尝试。由于性能原因丢弃String.Split,这样的事情应该比实施更快:

//DISCLAIMER; typed in my cell phone, not tested. Sure it has bugs but you should get the idea.
public string get_element(int index)
{
     var buffer = new StringBuilder();
     var counter = -1;

     using (var enumerator = text_line.GetEnumerator())
     {
         while (enumerator.MoveNext())
         {
             if (enumerator.Current == x12_reader.element_delimiter)
             {
                 counter++;
             }
             else if (counter == index)
             {
                 buffer.Append(enumerator.Current);
             }
             else if (counter > index)
                 break;
        }
     }

     return buffer.ToString();
}

答案 2 :(得分:0)

我不确定你到底在做什么,但如果我正确理解你的代码,那么元素会不会更简单,如下所示?

public string get_Element(int index)
{
    var elements = line_text.Split(new[] { x12_reader.element_delimiter });

    if (index > elements.Length)
        return "";

    return elements[index];
}