如何删除文本文件中的非ASCII字符?

时间:2018-10-05 08:55:17

标签: python

我有这个.log文件,我将扩展名更改为.txt文件,但它仍作为日志文件读取

enter image description here

但是在我将其复制并粘贴到新的编辑器并将其保存为.txt文件之后。这就是它的显示内容:

enter image description here

有人告诉我,这是我应该删除的非ASCII字符。有什么办法可以删除它或复制日志文件的内容,然后使用python将其放置在文本文件中?

1 个答案:

答案 0 :(得分:2)

在Python中,您可以指定输入编码。

with open('trendx.log', 'r', encoding='utf-16le') as reader, \
     open('trendx.txt', 'w') as writer:
   for line in reader:
        if "ROW" in line:
           writer.write(line)

我显然已经复制了您先前问题中的一些内容。最终确定实际问题的荣誉。

特别注意如何避免将整个文件读入内存,而是一次处理一行。