解析半格式化文件

时间:2013-04-15 01:18:29

标签: c# parsing text

我一直在努力寻找一种解析我经常看到的文本文件的好方法。问题不是解析简单的一行部分,而是解析跨越多行的部分,偶尔也包含:等字符。第二个问题是,在下一节之前偶尔会有一个随机行,它不能作为一个值:密钥对。

我的想法(虽然我还没有弄清楚如何对其进行编码)是因为SECTION值已知,所以它们可以在List<string>中提供,并且允许解析通过一个部分直到到达List<string>中的另一个值。这就是我到目前为止尝试使用我的代码。

我需要帮助的主要是找出多线问题,然后将所有内容存储在字典列表(List<Dictionary>)中,以便将每个部分存储在自己的字典中(或者如果有人有更好的想法,请通过一切手段)。

示例文字:

Lorem ipsum dolor sit amet, consectetur adipisicing
elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut
enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut
aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in
voluptate velit esse cillum dolore eu fugiat nulla pariatur.

SECTION1
  VALUE1: incididunt ut labore
  VALUE2: nostrud
  VALUE3: eiusmod tempor 
  VALUE4: Excepteur sint occaecat cupidatat non proident, sunt in
culpa qui officia deserunt mollit anim id est laborum. Lorem ipsum dolor
sit amet, consectetur adipisicing elit, sed do eiusmod tempor incididunt ut
labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud
exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat.
  VALUE5: Duis aute irure dolor in reprehenderit in voluptate
velit esse cillum dolore eu fugiat nulla pariatur. Excepteur sint occaecat
cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id
est laborum.

Lorem ipsum dolor sit amet, consectetur adipisicing
elit, sed do eiusmod tempor incididunt ut labore et dolore magna
aliqua.
SECTION2
  VALUE1: incididunt ut labore
  VALUE2: nostrud
  VALUE3: eiusmod tempor 
  VALUE4: Excepteur sint occaecat cupidatat non proident, sunt in
culpa qui officia deserunt mollit anim id est laborum. Lorem ipsum dolor
sit amet, consectetur adipisicing elit, sed do eiusmod tempor incididunt ut
labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud
exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat.
  VALUE5: Duis aute irure dolor in reprehenderit in voluptate
velit esse cillum dolore eu fugiat nulla pariatur. Excepteur sint occaecat
cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id
est laborum.

示例代码:

                        bool Sec1 = false;
                        bool Sec2 = false;

                        for (int i = 0; i < lines.Length; i++)
                        {

                            if (lines[i].Equals("SECTION1") || Sec1 == true)
                            {
                                if (lines[i + 1].StartsWith("  "))
                                {
                                    MessageBox.Show(lines[i + 1].Trim());
                                    Sec1 = true;
                                }
                                else
                                {
                                    Sec1 = false;
                                }
                            }
                            else if (lines[i].Equals("SECTION2") || Sec2 == true)
                            {
                                if (lines[i + 1].StartsWith("  "))
                                {
                                    MessageBox.Show(lines[i + 1].Trim());
                                    Sec2 = true;
                                }
                                else
                                {
                                    Sec2 = false;
                                }
                            }
                        }

1 个答案:

答案 0 :(得分:0)

我认为这对你有用。至少它应该给你一个提示:

private void Parse()
{
    var Dictionary = new List<List<string>>();
    var Section = new List<string>();

    using (var sr = new StreamReader(this.fileName))
    {
        while (sr.Peek() > -1) 
        {
            var line = sr.ReadLine().Trim();

            if (line.StartsWith("SECTION") && Section.Count > 0)
            {
                Dictionary.Add(Section); //// Store previous section
                Section = new List<string>();
            }

            if (line.StartsWith("VALUE"))
            {
                line = line.Remove(0, line.IndexOf(' '));
                Section.Add(line.Trim());
            }
        }

        if (Section.Count > 0)
        {
            Dictionary.Add(Section); //// Store last section
        }
    }
}