Question

我试图分析一个apache访问日志文件，并且我设法使用正则表达式来分割我感兴趣的部分。我试图在日志中找到唯一IP的数量（仅限主机）。

        for line in log.splitlines():
           result = pattern.match(line)
           IPs = list(result.groups()[0])
           print len(set(IPs))

我现在很失落。我似乎无法以一种形式获取IP，我可以使用len（）获取大小并设置（IP）以消除重复出现的IP。我意识到上面的代码是错误的。有什么建议吗？

Answer 1

解决！我逐行浏览文件，使用我的模式抓取IP并将它们添加到之前声明的大型列表中。然后在循环外的末尾使用len（set（IPs））。

Python - 查找唯一的组出现（正则表达式）。

1 个答案: