python过滤线匹配keyworks

时间:2019-02-19 19:05:08

标签: python regex linux scripting

我有正在工作的python脚本,产生以下输出。

import re
import sys
import socket
conn = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
conn.connect(('10.10.10.10', 25001))
conn.send('status\n')
data = conn.recv(16777216)
conn.close()
print data

脚本输出

session 3594154272 xwf9VgJQfRSSPBCyXYVRzlw==foo xh_iUVQ6JRieFv70JjDVOnQ==bar 13584
stream 102.22.133.12:33562 173.24.54.19:39814 10.10.10.10:12838 39382628/29008576/68391204 
session 3363219694 xiXdeg8oGTQ6MYZ-Z5q4iKw==foo xVBsa0nlZT4-vOLA8P-WxSw==bar 2319
stream 71.22.223.192:43718 115.125.65.61:41126 10.10.10.10:12802 4243204/9624660/13867864
....
....
.... 

现在,我希望输出中任何以stream开头的行,因此我正在使用以下逻辑,但它不起作用。

import re
import sys
import socket
conn = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
conn.connect(('10.10.10.10', 25001))
conn.send('status\n')
data = conn.recv(16777216)
conn.close()

# parse line contain stream
for line in data:
    if re.match(r'stream', line):
        print line,

1 个答案:

答案 0 :(得分:1)

您的data是庞大的string,而不是您所期望的list中的strings。同样,使用str.startswith代替正则表达式会更容易(减少资源消耗)。只需如下更改代码:

# parse line contain stream
for n, line in enumerate(data.split('\n')):
    if line.startswith('stream '):
        print line

ndata中行的总数。如果您只想计算遇到"stream"的特定时间:

count = 0
for line in data.split('\n'):
    if line.startswith('stream '):
        print line
        count += 1