Python - 查找唯一的组出现(正则表达式)。

时间:2017-05-06 01:07:55

标签: python

我试图分析一个apache访问日志文件,并且我设法使用正则表达式来分割我感兴趣的部分。我试图在日志中找到唯一IP的数量(仅限主机)。

        for line in log.splitlines():
           result = pattern.match(line)
           IPs = list(result.groups()[0])
           print len(set(IPs))

我现在很失落。我似乎无法以一种形式获取IP,我可以使用len()获取大小并设置(IP)以消除重复出现的IP。我意识到上面的代码是错误的。有什么建议吗?

1 个答案:

答案 0 :(得分:0)

解决!我逐行浏览文件,使用我的模式抓取IP并将它们添加到之前声明的大型列表中。然后在循环外的末尾使用len(set(IPs))。