使用选项卡“\ t”分隔符解析文件以获取特定选项卡

时间:2014-11-17 19:08:17

标签: java regex hashmap hashtable tokenize

我有一个文本文件,其中包含由" \ t"分隔的数据。我想解析这个文件来获得Coulmn-1和Coulmn-2。文件格式如下:

    Coulmn-1         Coulmn-2    Coulmn-3     Coulmn-4
        the               -       (A0*           *
    average               -          *           *
      price               -          *           *
         of               -          *           *
          a               -          *           *
     gallon               -          *           *
         of               -          *           *
   gasoline               -         *)           * 
        has               -          *           *
     jumped          jumped       (V*)           *

我想要做的是解析此文件并首先获取Coulmn-2的内容。我将把它用作" Hashtable"然后检查Coulmn-3。键的值将是column-1的内容。例如:我给出的示例中的键将被跳转,而值将是"一加仑汽油的平均价格"。要获得这个值,我必须检查Coulmn-3。该值将从"开始(A0 *"直到" *)"

我知道如何阅读解析文件,但我想知道如何开始。我是否应该逐行阅读并将所有这些信息放在一起,或者我应该多次阅读该文件以获取这些信息。谢谢,

1 个答案:

答案 0 :(得分:0)

我只是逐行解析它,跳过任何可选标题,将其拆分为相关列,然后将列提供给处理程序方法。 string的split方法可以为你工作,尽管如果你只想要一个特定的列

,正则表达式可能会更好