如何在python中获取带分隔符空间的列表的第n个参数

时间:2015-10-05 10:34:53

标签: python list list-comprehension

新手python学习者在这附近......

我想要实现的是从iptables日志文件中读取行,获取与“SRC =”匹配的参数,删除字符串“SRC =”并打印出唯一的IP。 在Bash中,使用awk等非常简单。 我阅读了关于理解列表和重新功能并深入研究的例子,但没有成功。有关列表/对象/字符串操作的任何提示都是受欢迎的。

代码:

import sys
import os
import re


with open("iptables.log","r") as f:
content = f.readlines()

print (type (content))
content = [l.replace('SRC=','') for l in content]

print (len(content))
print " ".join(content)

f.close()

日志:

Sep  1 09:27:46 hostname kernel: IPTables-Dropped: IN=eth0 OUT= MAC=00000 SRC=255.255.255.1 DST=10.0.0.1 LEN=56 TOS=0x00 PREC=0x00 TTL=10 ID=36829 DF PROTO=TCP SPT=490000 DPT=80 WINDOW=15500 RES=0x00 SYN URGP=0 MARK=0x32
Sep  1 09:27:47 hostname kernel: IPTables-Dropped: IN=eth0 OUT= MAC=00000 SRC=255.255.255.1 DST=10.0.0.1 LEN=56 TOS=0x00 PREC=0x00 TTL=10 ID=36830 DF PROTO=TCP SPT=490000 DPT=80 WINDOW=15500 RES=0x00 SYN URGP=0 MARK=0x32
Sep  1 09:27:47 hostname kernel: IPTables-Dropped: IN=eth0 OUT= MAC=00000 SRC=255.255.255.1 DST=10.0.0.1 LEN=56 TOS=0x00 PREC=0x00 TTL=10 ID=36830 DF PROTO=TCP SPT=490000 DPT=80 WINDOW=15500 RES=0x00 SYN URGP=0 MARK=0x32
Sep  1 09:27:47 hostname kernel: IPTables-Dropped: IN=eth0 OUT= MAC=00000 SRC=255.255.255.2 DST=10.0.0.1 LEN=56 TOS=0x00 PREC=0x00 TTL=10 ID=36830 DF PROTO=TCP SPT=490000 DPT=80 WINDOW=15500 RES=0x00 SYN URGP=0 MARK=0x32

印刷品应该是:

255.255.255.1
255.255.255.2

如何在python中使用分隔符“”(空格)获取第n个参数?

3 个答案:

答案 0 :(得分:0)

如果您的字符串只包含一行输入,则可以

parts = line.split()
ip = parts[9][4:]

示例输出:     255.255.255.1

当然,您可能希望对这些列表进行一些合适的范围检查!

live example

string.split将从单个字符串生成一个字符串列表,按您选择的分隔符(默认为空格)进行拆分。 然后,您可以索引该列表以选择与SRC=xx.xx.xx.xx对应的列表,并使用string slicing返回仅包含IP地址的子字符串。

更强大的方法可能是使用正则表达式匹配SRC=xx.xx.xx.xx行并提取IP地址。

答案 1 :(得分:0)

您可以使用str.split()按空格分割元素,然后从中获取第10个元素(这将是SRC=的元素)。然后替换其中的SRC=,或者您可以使用下标'SRE='简单地获取子字符串(删除前四个字符[4:])。

此外,如果您只想要唯一元素,则可以在Python 2.7 +中使用set comprehension。

示例 -

lstset = {l.split()[9].replace('SRC=','') for l in content}
print('\n'.join(lstset))

演示 -

>>> content = """Sep  1 09:27:46 hostname kernel: IPTables-Dropped: IN=eth0 OUT= MAC=00000 SRC=255.255.255.1 DST=10.0.0.1 LEN=56 TOS=0x00 PREC=0x00 TTL=10 ID=36829 DF PROTO=TCP SPT=490000 DPT=80 WINDOW=15500 RES=0x00 SYN URGP=0 MARK=0x32
... Sep  1 09:27:47 hostname kernel: IPTables-Dropped: IN=eth0 OUT= MAC=00000 SRC=255.255.255.1 DST=10.0.0.1 LEN=56 TOS=0x00 PREC=0x00 TTL=10 ID=36830 DF PROTO=TCP SPT=490000 DPT=80 WINDOW=15500 RES=0x00 SYN URGP=0 MARK=0x32
... Sep  1 09:27:47 hostname kernel: IPTables-Dropped: IN=eth0 OUT= MAC=00000 SRC=255.255.255.1 DST=10.0.0.1 LEN=56 TOS=0x00 PREC=0x00 TTL=10 ID=36830 DF PROTO=TCP SPT=490000 DPT=80 WINDOW=15500 RES=0x00 SYN URGP=0 MARK=0x32
... Sep  1 09:27:47 hostname kernel: IPTables-Dropped: IN=eth0 OUT= MAC=00000 SRC=255.255.255.2 DST=10.0.0.1 LEN=56 TOS=0x00 PREC=0x00 TTL=10 ID=36830 DF PROTO=TCP SPT=490000 DPT=80 WINDOW=15500 RES=0x00 SYN URGP=0 MARK=0x32""".splitlines()
>>> lstset = {l.split()[9].replace('SRC=','') for l in content}
>>> print('\n'.join(lstset))
255.255.255.1
255.255.255.2

但更好的方法(和更慢的方法)是使用正则表达式。示例 -

import re
reqset = {re.search('SRC=(\S+)',l).group(1) for l in content}
print('\n'.join(reqset))

演示 -

>>> reqset = {re.search('SRC=(\S+)',l).group(1) for l in content}
>>> print('\n'.join(reqset))
255.255.255.1
255.255.255.2

答案 2 :(得分:0)

最后遵循这种方法:

import sys
import os
import re

for line in open("iptables.log","r"):

 list = line.strip().split(" ")
 if re.search("SRC=", line):

  ip = list[10].strip().split("=")
  print ip[1]