我有一个文本文件,我尝试在Mac上使用Sublime Text打开。当我打开文件时,我看到这样的数据......
efbf bdef bfbd 5300 4b00 5500 0900 4900
4d00 4100 4700 4500 5500 5200 4c00 0900
如果我尝试使用UTF LE 16编码重新打开,我会看到..
뿯붿SKU
你能帮我确定一下这个文件的格式和/或编码吗?
如果我用Excel或Mac的TextEdit打开文件,我也会在Sublime上看到与UTF LE 16编码相同的内容。
因此,如果文件是UTF LE 16编码,那些特殊字符是什么?
答案 0 :(得分:2)
EF BF BD是以UTF-8编码的替换字符。这可能意味着这些数据采用的格式不是UTF-8(比如ISO-8859-1),而是在某个时候被UTF-8系统解析,该系统用REPLACEMENT CHARACTER替换了非法字节。
如果没有更多关于如何获得此文件的背景信息,很难推测出确切的原因。甚至可能它的Sublime Text正在进行此替换并且文件本身处于其他编码状态(并且尚未被修改)。
我会确保这些实际上是文件中的字节,并且它不仅仅是Sublime Text以有趣的方式显示它。使用像xxd
这样的简单工具将内容转储为十六进制字节,并确保它确实存在于那里。