我有正在工作的python脚本,产生以下输出。
import re
import sys
import socket
conn = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
conn.connect(('10.10.10.10', 25001))
conn.send('status\n')
data = conn.recv(16777216)
conn.close()
print data
脚本输出
session 3594154272 xwf9VgJQfRSSPBCyXYVRzlw==foo xh_iUVQ6JRieFv70JjDVOnQ==bar 13584
stream 102.22.133.12:33562 173.24.54.19:39814 10.10.10.10:12838 39382628/29008576/68391204
session 3363219694 xiXdeg8oGTQ6MYZ-Z5q4iKw==foo xVBsa0nlZT4-vOLA8P-WxSw==bar 2319
stream 71.22.223.192:43718 115.125.65.61:41126 10.10.10.10:12802 4243204/9624660/13867864
....
....
....
现在,我希望输出中任何以stream
开头的行,因此我正在使用以下逻辑,但它不起作用。
import re
import sys
import socket
conn = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
conn.connect(('10.10.10.10', 25001))
conn.send('status\n')
data = conn.recv(16777216)
conn.close()
# parse line contain stream
for line in data:
if re.match(r'stream', line):
print line,
答案 0 :(得分:1)
您的data
是庞大的string
,而不是您所期望的list
中的strings
。同样,使用str.startswith
代替正则表达式会更容易(减少资源消耗)。只需如下更改代码:
# parse line contain stream
for n, line in enumerate(data.split('\n')):
if line.startswith('stream '):
print line
n
是data
中行的总数。如果您只想计算遇到"stream"
的特定时间:
count = 0
for line in data.split('\n'):
if line.startswith('stream '):
print line
count += 1