新手python学习者在这附近......
我想要实现的是从iptables日志文件中读取行,获取与“SRC =”匹配的参数,删除字符串“SRC =”并打印出唯一的IP。 在Bash中,使用awk等非常简单。 我阅读了关于理解列表和重新功能并深入研究的例子,但没有成功。有关列表/对象/字符串操作的任何提示都是受欢迎的。
代码:
import sys
import os
import re
with open("iptables.log","r") as f:
content = f.readlines()
print (type (content))
content = [l.replace('SRC=','') for l in content]
print (len(content))
print " ".join(content)
f.close()
日志:
Sep 1 09:27:46 hostname kernel: IPTables-Dropped: IN=eth0 OUT= MAC=00000 SRC=255.255.255.1 DST=10.0.0.1 LEN=56 TOS=0x00 PREC=0x00 TTL=10 ID=36829 DF PROTO=TCP SPT=490000 DPT=80 WINDOW=15500 RES=0x00 SYN URGP=0 MARK=0x32
Sep 1 09:27:47 hostname kernel: IPTables-Dropped: IN=eth0 OUT= MAC=00000 SRC=255.255.255.1 DST=10.0.0.1 LEN=56 TOS=0x00 PREC=0x00 TTL=10 ID=36830 DF PROTO=TCP SPT=490000 DPT=80 WINDOW=15500 RES=0x00 SYN URGP=0 MARK=0x32
Sep 1 09:27:47 hostname kernel: IPTables-Dropped: IN=eth0 OUT= MAC=00000 SRC=255.255.255.1 DST=10.0.0.1 LEN=56 TOS=0x00 PREC=0x00 TTL=10 ID=36830 DF PROTO=TCP SPT=490000 DPT=80 WINDOW=15500 RES=0x00 SYN URGP=0 MARK=0x32
Sep 1 09:27:47 hostname kernel: IPTables-Dropped: IN=eth0 OUT= MAC=00000 SRC=255.255.255.2 DST=10.0.0.1 LEN=56 TOS=0x00 PREC=0x00 TTL=10 ID=36830 DF PROTO=TCP SPT=490000 DPT=80 WINDOW=15500 RES=0x00 SYN URGP=0 MARK=0x32
印刷品应该是:
255.255.255.1
255.255.255.2
如何在python中使用分隔符“”(空格)获取第n个参数?
答案 0 :(得分:0)
如果您的字符串只包含一行输入,则可以
parts = line.split()
ip = parts[9][4:]
示例输出: 255.255.255.1
当然,您可能希望对这些列表进行一些合适的范围检查!
string.split将从单个字符串生成一个字符串列表,按您选择的分隔符(默认为空格)进行拆分。
然后,您可以索引该列表以选择与SRC=xx.xx.xx.xx
对应的列表,并使用string slicing返回仅包含IP地址的子字符串。
更强大的方法可能是使用正则表达式匹配SRC=xx.xx.xx.xx
行并提取IP地址。
答案 1 :(得分:0)
您可以使用str.split()
按空格分割元素,然后从中获取第10个元素(这将是SRC=
的元素)。然后替换其中的SRC=
,或者您可以使用下标'SRE='
简单地获取子字符串(删除前四个字符[4:]
)。
此外,如果您只想要唯一元素,则可以在Python 2.7 +中使用set comprehension。
示例 -
lstset = {l.split()[9].replace('SRC=','') for l in content}
print('\n'.join(lstset))
演示 -
>>> content = """Sep 1 09:27:46 hostname kernel: IPTables-Dropped: IN=eth0 OUT= MAC=00000 SRC=255.255.255.1 DST=10.0.0.1 LEN=56 TOS=0x00 PREC=0x00 TTL=10 ID=36829 DF PROTO=TCP SPT=490000 DPT=80 WINDOW=15500 RES=0x00 SYN URGP=0 MARK=0x32
... Sep 1 09:27:47 hostname kernel: IPTables-Dropped: IN=eth0 OUT= MAC=00000 SRC=255.255.255.1 DST=10.0.0.1 LEN=56 TOS=0x00 PREC=0x00 TTL=10 ID=36830 DF PROTO=TCP SPT=490000 DPT=80 WINDOW=15500 RES=0x00 SYN URGP=0 MARK=0x32
... Sep 1 09:27:47 hostname kernel: IPTables-Dropped: IN=eth0 OUT= MAC=00000 SRC=255.255.255.1 DST=10.0.0.1 LEN=56 TOS=0x00 PREC=0x00 TTL=10 ID=36830 DF PROTO=TCP SPT=490000 DPT=80 WINDOW=15500 RES=0x00 SYN URGP=0 MARK=0x32
... Sep 1 09:27:47 hostname kernel: IPTables-Dropped: IN=eth0 OUT= MAC=00000 SRC=255.255.255.2 DST=10.0.0.1 LEN=56 TOS=0x00 PREC=0x00 TTL=10 ID=36830 DF PROTO=TCP SPT=490000 DPT=80 WINDOW=15500 RES=0x00 SYN URGP=0 MARK=0x32""".splitlines()
>>> lstset = {l.split()[9].replace('SRC=','') for l in content}
>>> print('\n'.join(lstset))
255.255.255.1
255.255.255.2
但更好的方法(和更慢的方法)是使用正则表达式。示例 -
import re
reqset = {re.search('SRC=(\S+)',l).group(1) for l in content}
print('\n'.join(reqset))
演示 -
>>> reqset = {re.search('SRC=(\S+)',l).group(1) for l in content}
>>> print('\n'.join(reqset))
255.255.255.1
255.255.255.2
答案 2 :(得分:0)
最后遵循这种方法:
import sys
import os
import re
for line in open("iptables.log","r"):
list = line.strip().split(" ")
if re.search("SRC=", line):
ip = list[10].strip().split("=")
print ip[1]