我想从日志文件中获取特定信息,并通过一些字符串对其进行过滤。我收到以下错误消息时选择使用codecs.open
:
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb4 in position 3167: invalid start byte
。
问题不是编码不像utf-16这样。
这样做使错误消失,但是现在此脚本花费的时间比以前更长。有什么方法可以优化它以减少运行时间?
listeFull = codecs.open("file", "r",encoding='utf-8', errors='ignore')
strings = ("str1","str2","str3")
net = "0.0.0.0"
for line in listeFull:
if net in line:
if all(s not in line for s in strings):
print(line)
listeFull.close()