如何在python中搜索一系列行?

时间:2013-10-21 18:45:22

标签: python regex sed

我想在两个日期之间搜索日期排序日志文件中的一系列行。如果我在命令行,sed会派上用场:

sed -rn '/03.Nov.2012/,/12.Oct.2013/s/search key/search key/p' my.log

以上内容仅显示2012年11月3日至2013年10月12日期间包含字符串“search key”的行。

我是否可以通过python轻松实现这一目标?

我可以为上面建立一个单独的RE,但这将是噩梦。

我能想出的最好的是:

#!/usr/bin/python

start_date = "03/Nov/2012"
end_date = "12/Oct/2013"

start = False

try:
    with open("my.log",'r') as log:
        for line in log:
            if start:
                if end_date in line:
                    break
            else:
                if start_date in line:
                    start = True
                else:
                    continue
            if search_key in line:
                print line

except IOError, e:
    print '<p>Log file not found.'

但这让我觉得不是'pythonic'。

可以假设搜索日期限制将在日志文件中找到。

1 个答案:

答案 0 :(得分:5)

使用itertools和生成器是一种方式:

from itertools import takewhile, dropwhile

with open('logfile') as fin:
    start = dropwhile(lambda L: '03.Nov.2012' not in L, fin)
    until = takewhile(lambda L: '12.Oct.2013' not in L, start)
    query = (line for line in until if 'search string' in line)
    for line in query:
        pass # do something