我试图分析一个apache访问日志文件,并且我设法使用正则表达式来分割我感兴趣的部分。我试图在日志中找到唯一IP的数量(仅限主机)。
for line in log.splitlines():
result = pattern.match(line)
IPs = list(result.groups()[0])
print len(set(IPs))
我现在很失落。我似乎无法以一种形式获取IP,我可以使用len()获取大小并设置(IP)以消除重复出现的IP。我意识到上面的代码是错误的。有什么建议吗?
答案 0 :(得分:0)
解决!我逐行浏览文件,使用我的模式抓取IP并将它们添加到之前声明的大型列表中。然后在循环外的末尾使用len(set(IPs))。