从文件中读取每行到Python中的列表

时间:2017-08-27 20:24:37

标签: python file encoding character-encoding special-characters

这是我的代码:

with open(path) as file:
    lines = file.readlines()
    print lines[0:5]

但是我会收到很多额外的字符,例如:

['cat2\xc2\xa0\xc2\xa0 2\xc2\xa0 0', 'cat1\xc2\xa00.5\xc2\xa0 0', 'cat2\xc2\xa0\xc2\xa0 1\xc2\xa0 0', 'cat1\xc2\xa0\xc2\xa0 0\xc2\xa0 0', 'cat2\xc2\xa0\xc2\xa0 0\xc2\xa0 3']

为什么我会得到它们?

原始文本文件是:

cat2   2  0
cat1 0.5  0
cat2   1  0
cat1   0  0
cat2   0  3

1 个答案:

答案 0 :(得分:2)

\xc2\xa0non-breaking space。将其替换为文件中的常规空格。

此序列出现在许多编码中,包括UTF-8

详情请见Wikipedia