我有一个包含以下数据的文本文件:
<miscellaneous text for several lines>
User ID Name
USERA Test User 1
USERB Test User 2
....
<more miscellaneous text for several lines>
我正在尝试将用户ID和名称拉出来,以便将其输出到.csv文件中。所以我想第一步是加载文件并将文本文件的内容放入字符串
这是我的代码:
with open('FILE.txt', 'rb') as f:
file = f.read()
print(file)
为什么要加载unicode NULL字符?我该怎么做才能解决这个问题?
此外,有更有效的方法吗?我的计划只是做正则表达式匹配,但效率不高
答案 0 :(得分:2)
看起来该文件使用UTF-16。使用正确的编解码器,你应该没问题。