Python:加载文件包含所有Unicode字符

时间:2016-06-01 17:37:00

标签: python python-3.x unicode

我有一个包含以下数据的文本文件:

<miscellaneous text for several lines>
User ID    Name
USERA      Test User 1
USERB      Test User 2
....
<more miscellaneous text for several lines>

我正在尝试将用户ID和名称拉出来,以便将其输出到.csv文件中。所以我想第一步是加载文件并将文本文件的内容放入字符串

这是我的代码:

with open('FILE.txt', 'rb') as f:
    file = f.read()
    print(file)

但是输出如下: enter image description here

为什么要加载unicode NULL字符?我该怎么做才能解决这个问题?

此外,有更有效的方法吗?我的计划只是做正则表达式匹配,但效率不高

1 个答案:

答案 0 :(得分:2)

看起来该文件使用UTF-16。使用正确的编解码器,你应该没问题。