我有一个测试存根,它会将几条日志消息写入系统日志。
但是,此系统日志也会被许多其他应用程序更新。所以,基本上,我想做一个tail -f system.log | grep "application name"
来获取适当的日志消息。
我正在研究dbaez生成器技巧,我正在尝试将http://www.dabeaz.com/generators/follow.py和http://www.dabeaz.com/generators/apachelog.py
结合起来所以,在我的__main__()
中,我有类似的东西:
try:
dosomeprocessing() #outputs stuff to the log file
在dosomeprocessing()中,我运行一个循环,对于每个循环,我想查看是否有任何由我的应用程序引起的新日志消息,并且不一定将其打印出来,而是将它们存储在某处进行一些验证
logfile = open("/var/adm/messages","r")
loglines = follow(logfile)
logpats = r'I2G(JV)'
logpat = re.compile(logpats)
groups = (logpat.match(line) for line in loglines)
for g in groups:
if g:
print g.groups()
日志类似于:
Feb 4 12:55:27 Someprocessname.py I2G(JV)-300[20448]: [ID 702911 local2.error] [MSG-70047] xxxxxxxxxxxxxxxxxxxxxxx
Feb 4 12:55:27 Someprocessname.py I2G(JV)-300[20448]: [ID 702911 local2.error] [MSG-70055] xxxxxxxxxxxxxxxxxxxxxxx
除了很多其他的gobblygook。
现在,它被困在for g中:
我对python和异步编程比较陌生。理想情况下,我希望能够使尾部与主进程并行运行,并在每个循环中读取新数据。
如果我需要添加更多信息,请与我们联系。
答案 0 :(得分:4)
我建议您使用watchdog或pyinotify来监控对日志文件的更改。
另外,我建议记住你读到的最后一个位置。收到IN_MODIFY通知后,您可以从上一个位置读取到文件末尾并再次应用循环。此外,如果文件大小超过文件大小,则将最后一个位置重置为0。
以下是示例:
import pyinotify
import re
import os
wm = pyinotify.WatchManager()
mask = pyinotify.IN_MODIFY
class EventHandler (pyinotify.ProcessEvent):
def __init__(self, file_path, *args, **kwargs):
super(EventHandler, self).__init__(*args, **kwargs)
self.file_path = file_path
self._last_position = 0
logpats = r'I2G\(JV\)'
self._logpat = re.compile(logpats)
def process_IN_MODIFY(self, event):
print "File changed: ", event.pathname
if self._last_position > os.path.getsize(self.file_path):
self._last_position = 0
with open(self.file_path) as f:
f.seek(self._last_position)
loglines = f.readlines()
self._last_position = f.tell()
groups = (self._logpat.search(line.strip()) for line in loglines)
for g in groups:
if g:
print g.string
handler = EventHandler('some_log.log')
notifier = pyinotify.Notifier(wm, handler)
wm.add_watch(handler.file_path, mask)
notifier.loop()