Question

我有一个文本文件，其中包含由＆＃34; \ t＆＃34;分隔的数据。我想解析这个文件来获得Coulmn-1和Coulmn-2。文件格式如下：

    Coulmn-1         Coulmn-2    Coulmn-3     Coulmn-4
        the               -       (A0*           *
    average               -          *           *
      price               -          *           *
         of               -          *           *
          a               -          *           *
     gallon               -          *           *
         of               -          *           *
   gasoline               -         *)           * 
        has               -          *           *
     jumped          jumped       (V*)           *

我想要做的是解析此文件并首先获取Coulmn-2的内容。我将把它用作＆＃34; Hashtable＆＃34;然后检查Coulmn-3。键的值将是column-1的内容。例如：我给出的示例中的键将被跳转，而值将是＆＃34;一加仑汽油的平均价格＆＃34;。要获得这个值，我必须检查Coulmn-3。该值将从＆＃34;开始（A0 *＆＃34;直到＆＃34; *）＆＃34;

我知道如何阅读解析文件，但我想知道如何开始。我是否应该逐行阅读并将所有这些信息放在一起，或者我应该多次阅读该文件以获取这些信息。谢谢，

Answer 1

我只是逐行解析它，跳过任何可选标题，将其拆分为相关列，然后将列提供给处理程序方法。 string的split方法可以为你工作，尽管如果你只想要一个特定的列

，正则表达式可能会更好

使用选项卡“\ t”分隔符解析文件以获取特定选项卡

1 个答案: