将日志文件拆分为由正则表达式分隔的块

时间:2013-11-07 11:59:12

标签: java regex file java.util.scanner

将日志文件拆分为由正则表达式分隔的块的最有效方法是什么。

日志文件包含多个请求/块(每个块的行数是可变的 - 取决于方法等)

识别先前请求/块完成的唯一方法是通过EOF或另一个请求/块的开始:使用特定消息。

我想,使用此特定消息的正则表达式来拆分整个文件并获取块以便分别解析每个文件。

日志文件的结构:

START_A_NEW_BLOCK_1:
Lorem ipsum dolor sit amet, consectetur adipiscing elit
Lorem ipsum dolor sit amet, consectetur adipiscing elit
Lorem ipsum dolor sit amet, consectetur adipiscing elit



Lorem ipsum dolor sit amet, consectetur adipiscing elit

Lorem ipsum dolor sit amet, consectetur adipiscing elit
Lorem ipsum dolor sit amet, consectetur adipiscing elit



START_A_NEW_BLOCK_2:
Lorem ipsum dolor sit amet, consectetur adipiscing elit
Lorem ipsum dolor sit amet, consectetur adipiscing elit

Lorem ipsum dolor sit amet, consectetur adipiscing elit
Lorem ipsum dolor sit amet, consectetur adipiscing elit

1 个答案:

答案 0 :(得分:1)

String[] res = str.split( "START_A_NEW_BLOCK_\d+:" );