必须解析大型日志文件,并且必须将特定字符串之间的内容输出到单个文件。 即。
2019-02-15 21:44:46,620 INFO Blah Blah ----------------- 2019-02-15 21:49:57,499 INFO Starting activity for Id:abcd001 .... [a lot of info possible ERRORS] 2019-02-15 21:59:41,162 INFO Ending activity for Id:abcd001 2019-02-15 22:44:46,620 INFO Blah Blah ----------------- 2019-02-15 22:49:57,499 INFO Starting activity for Id:abcd002 .... [a lot of info possible ERRORS] 2019-02-15 25:23:46,620 INFO Blah Blah ----------------- 2019-02-15 28:28:57,499 INFO Starting activity for Id:abcd003 .... [a lot of info possible ERRORS] 2019-02-15 29:09:41,162 INFO Ending activity for Id:abcd001 2019-02-15 30:23:46,620 INFO Blah Blah
每个活动都封装在“ ----------------”标记之间(请注意,有时缺少活动结尾行)。目标是为每个活动创建单独的文件,我们可以在其中解析文本以提取ID并检查是否存在任何错误:例如输出file_activity_001.txt file_activity_002.txt等。
到目前为止,我已经找到了多种方法来使用PS从文件中提取文本,但是仅提取到一个输出文件中。