在c#中的文本文件中读取不同的块

时间:2013-09-25 18:45:25

标签: c# parsing text

我正在使用visual c#构建表单应用程序。我的问题是我需要读取红色下划线的所有列(如图所示)并跳过蓝色的列:

Picture

我不知道我是否应该使用readline或readblock方法。此外,程序如何知道红色列何时结束以及如何转到下一个红色列。我必须使用字符数吗?

这是我目前的代码:

  private void button1_Click(object sender, EventArgs e)
    {
        OpenFileDialog ofd = new OpenFileDialog();
        if (ofd.ShowDialog() == System.Windows.Forms.DialogResult.OK)
        {
            StreamReader sr = new StreamReader(File.OpenRead(ofd.FileName));
            // constructor sr accesses streamreader class. In stream reader class we access method read to end
            textBox1.Text = sr.ReadToEnd();
            // fill textbox with this.
            sr.Dispose();

        }
    }

我很抱歉,我是初学者 - 真的很感激帮助。

1 个答案:

答案 0 :(得分:1)

看起来两个非常简单的规则可以帮助处理这些文件:

1)第一列(不是空格)中带有字符的行会使您退出表格模式。

2)具有相等和空格组的行并且其他任何内容都不会启动表模式。    
a)由等号部分宽度定义的列宽    
b)前一行通常给出列名

使用它可以为这种形式的文件创建一般解析器。只需一次读一行,然后根据您阅读的每一行应用输入离开表的规则。 (如果你想要标题名称,请保持一次性)

编辑:添加了代码示例。 (问题是由“第一行”整个程序大多写的)

using( StreamReader input = new StreamReader("somefile.txt") )
{
   List<int> bounds = new List<int>();
   for( string line = input.ReadLine(); line != null; line = input.ReadLine() )
   {
      if( line.Length > 0 && line[0] == '-' )
         bounds.Clear();
      if( Regex.IsMatch(line, "^ *=[ =]*$") ) // This is a column header
      {
         bounds.Clear();
         for( int i = 1; i<line.Length; ++i )
            if( line[i - 1] != line[i] )
               bounds.Add(i);
      }
      else if( bounds.Count > 0 )
      {
         List<string> cells = new List<string>();
         string padLine = line.PadRight(bounds[bounds.Count-1]);
         for( int i=0; i<bounds.Count; i += 2 )
            cells.Insert(i / 2, padLine.Substring(bounds[i], bounds[i+1]));
         // retrieve data cells[7] (column 7) here and store elsewhere.  
      }
   }
}