我有一个大的日志文件,我需要确认按时间顺序排列的时间戳序列。我知道如何读取第1行并提取时间戳。然后我需要将它与第2行>进行比较。最后一行。如果有任何早于第1行的内容,则打印整行并继续直到最后一行。然后读取第2行并重复上面的第3行>最后一行。然后读取第3行并重复上面第4行>最后一行。从日志文件中读取外部循环没有问题,但是如何从第n + 1行开始再次读取相同的文件,而外部循环正在读取的行号是什么?即如果外部循环有读取行10,如何从内部循环读取从第11行开始的文件?日志文件有10,000行,我有几十个日志文件要处理,所以速度很重要。
日志文件行格式为:
Sep 17 16:09:51 2014 blah blah blah ...
9月17日16:09:52 2014 blah blah blah ...
9月17日16:09:52 2014 blah blah blah ...
9月17日15:11:10 2014 blah blah blah ...
9月17日16:11:10 2014 blah blah blah ...
我试图检测第4行的条目。
如果它更快,我可以切换到Perl
我应该将日志文件读入数组以使内部循环相对读取位置容易,或文件大小是否会使数组大小过高?