基于定义格式的文本提取?

时间:2015-05-11 13:13:35

标签: java scala parsing information-retrieval rule-engine

  1. 我必须处理一个提供给我的日志文件的任务。
  2. 此日志文件由CISCO ASA Firewall生成。
  3. 日志行如下所示:

    2013-05-09 11:04:32     Local4.Debug    172.24.100.111 
    %ASA-7-710005: TCP request discarded from 172.17.38.35/63867 to
    inside:172.24.100.111/443 2013-05-09 11:04:32     Local4.Debug   
    172.24.100.111  %ASA-7-609002: Teardown local-host outside:207.46.15.252 duration 0:00:00 2013-05-09 11:04:32    
    Local4.Debug    172.24.100.111  %ASA-7-609001: Built local-host
    outside:64.145.75.27 2013-05-09 11:04:32     Local4.Debug   
    172.24.100.111  %ASA-7-609002: Teardown local-host outside:64.145.75.27 duration 0:00:00 2013-05-09 11:04:32    
    Local4.Debug    172.24.100.111  %ASA-7-609001: Built local-host
    outside:216.156.147.26 2013-05-09 11:04:32     Local4.Debug   
    172.24.100.111  %ASA-7-609002: Teardown local-host outside:216.156.147.26 duration 0:00:00 2013-05-09 11:04:33    
    Local4.Debug    172.24.100.111  %ASA-7-609001: Built local-host
    outside:74.125.224.220 2013-05-09 11:04:33     Local4.Debug   
    172.24.100.111  %ASA-7-609002: Teardown local-host outside:74.125.224.220 duration 0:00:00 2013-05-09 11:04:34    
    Local4.Debug    172.24.100.111  %ASA-7-710005: UDP request discarded
    from 172.24.6.11/68 to inside:255.255.255.255/67
    
  4. 我环顾四周,发现这些规则在handbook

    中已明确定义

    问题

    1. 根据手册中提到的规则提取每条信息的最佳方法是什么,而不是运行正则表达式并获取价值?我的意思是我们可以生成基于规则的解析吗?
    2. 鉴于这是其中一个日志,我确信许多防火墙会支持许多日志格式,并且它们将有自己的指导如何阅读,是否有可以构建的通用框架?什么框架/库可以帮助您?
    3. 我正在寻找指导,因为我对这方面的了解不多。

      谢谢

0 个答案:

没有答案