我想在两个日期之间搜索日期排序日志文件中的一系列行。如果我在命令行,sed
会派上用场:
sed -rn '/03.Nov.2012/,/12.Oct.2013/s/search key/search key/p' my.log
以上内容仅显示2012年11月3日至2013年10月12日期间包含字符串“search key
”的行。
我是否可以通过python
轻松实现这一目标?
我可以为上面建立一个单独的RE,但这将是噩梦。
我能想出的最好的是:
#!/usr/bin/python
start_date = "03/Nov/2012"
end_date = "12/Oct/2013"
start = False
try:
with open("my.log",'r') as log:
for line in log:
if start:
if end_date in line:
break
else:
if start_date in line:
start = True
else:
continue
if search_key in line:
print line
except IOError, e:
print '<p>Log file not found.'
但这让我觉得不是'pythonic'。
可以假设搜索日期限制将在日志文件中找到。
答案 0 :(得分:5)
使用itertools
和生成器是一种方式:
from itertools import takewhile, dropwhile
with open('logfile') as fin:
start = dropwhile(lambda L: '03.Nov.2012' not in L, fin)
until = takewhile(lambda L: '12.Oct.2013' not in L, start)
query = (line for line in until if 'search string' in line)
for line in query:
pass # do something