Python:查找未知输出类型

时间:2016-11-23 19:24:54

标签: python string decode

我一直在努力解决这个问题几个星期......我有一份来自外部程序的报告。

它生成一个错误日志(70K行),可以读取为如下所示的文本:

Report Output as Text

然而,当我尝试在其中找到字符串“warnings”(确认它在那里)时,它找不到任何东西。

我尝试循环遍历它并让Python打印出它读取的每个单词,输出看起来很奇怪......好像每个字母之间有很多间距:

Python print out

我简直无法弄清楚为什么Python会像这样读取它或者如何在字符串中找到我正在寻找的单词。

代码我过去遍历文件并打印每一行:

import io

f = open('J:\Temp\Errors\PerfupD.txt', 'r')
lines = f.readlines()
for words in lines:
    print(words)

我用来搜索的代码:

import io

f = open('J:\Temp\Errors\PerfupD.txt', 'r')
lines = f.readlines()
if "warnings" in lines:
    print("Error found")

我尝试将其作为字节读取并搜索b“警告”。 尝试过读取字节,解码到cp437,latin-1,windows-1252(因为解码UTF-8不起作用),然后搜索......没什么用!!!

请帮忙。

0 个答案:

没有答案