我正在尝试解析文本文件。我想将行拆分为标记,但使用split命令会导致" \ x00"字符串与我看到的每个字符交替出现。
示例1:
之类的行"Language" "English"
变为
['\x00"\x00L\x00a\x00n\x00g\x00u\x00a\x00g\x00e\x00"\x00', '\x00"\x00E\x00n\x00g\x00l\x00i\x00s\x00h\x00"\x00\r\x00']
在line.split("//")[0].strip().split(None, 1)
之后
示例2 :由
组成的简单行{
变为
['\x00{\x00', '\x00']
我想知道它是否与文本文件的编码有关,我不知道如何检查。