Python脚本分析日志文件

时间:2014-04-08 09:01:49

标签: python log-analysis

我正在创建一个python脚本来分析日志文件(例如:http://www.monitorware.com/en/logsamples/apache.php),并且需要我可以用来实现此目的的方法建议。

  1. 使用open方法读取日志文件。行。
  2. 计算日志的已用时间?我可以使用哪种方法从日志行中的特定位置读取?示例:64.242.88.10 - - [07/Mar/2004:16:05:49 -0800] "GET /twiki/bin/edit/Main/Double_bounce_sender?topicparent=Main.ConfigurationVariables HTTP/1.1" 401 12846 在这种情况下,如何计算像年份这样的特定位置之后的经过时间?

    我还需要显示每分钟提供的请求数,发送的数据总量,平均发送的数据量,单个请求中发送的最大数据量。

1 个答案:

答案 0 :(得分:3)

我使用re模块从文本中提取信息(搜索,子搜索等)。

然后strptime可能是您的朋友将这些日期时间值转换为日期时间并对其进行计算。

之后,我会使用numpy.ndarray来存储数据并生成更多报告。

我也喜欢matplotlib和像hist这样的功能来制作精美的地块。