Question

我有正在工作的python脚本，产生以下输出。

import re
import sys
import socket
conn = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
conn.connect(('10.10.10.10', 25001))
conn.send('status\n')
data = conn.recv(16777216)
conn.close()
print data

脚本输出

session 3594154272 xwf9VgJQfRSSPBCyXYVRzlw==foo xh_iUVQ6JRieFv70JjDVOnQ==bar 13584
stream 102.22.133.12:33562 173.24.54.19:39814 10.10.10.10:12838 39382628/29008576/68391204 
session 3363219694 xiXdeg8oGTQ6MYZ-Z5q4iKw==foo xVBsa0nlZT4-vOLA8P-WxSw==bar 2319
stream 71.22.223.192:43718 115.125.65.61:41126 10.10.10.10:12802 4243204/9624660/13867864
....
....
....

现在，我希望输出中任何以stream开头的行，因此我正在使用以下逻辑，但它不起作用。

import re
import sys
import socket
conn = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
conn.connect(('10.10.10.10', 25001))
conn.send('status\n')
data = conn.recv(16777216)
conn.close()

# parse line contain stream
for line in data:
    if re.match(r'stream', line):
        print line,

Answer 1

您的data是庞大的string，而不是您所期望的list中的strings。同样，使用str.startswith代替正则表达式会更容易（减少资源消耗）。只需如下更改代码：

# parse line contain stream
for n, line in enumerate(data.split('\n')):
    if line.startswith('stream '):
        print line

n是data中行的总数。如果您只想计算遇到"stream"的特定时间：

count = 0
for line in data.split('\n'):
    if line.startswith('stream '):
        print line
        count += 1

python过滤线匹配keyworks

1 个答案: