我输入了
file -I *
查看整个目录中所有CSV文件的所有编码。很多文件编码都是charset = binary。我对这种编码格式不太熟悉。
有谁知道如何处理这种编码?
非常感谢你的时间。
答案 0 :(得分:4)
“二进制”编码几乎意味着编码 unknown 。
一切都是二进制数据。在文本文件中,每个字节或字节序列代表一个特定的字符,特别是哪个字符取决于编码,该文件是使用/解释文件编码的。有些编码是明确可识别的,有些则不是(例如,任何文件在任何单字节编码中都有效,您不能轻易区分一个单字节编码与另一个字节编码)。 file
用charset=binary
告诉你的是它没有比文件包含位和字节更多的具体信息(Capt'n明显拯救)。您可以使用正确的编码来解释文件/将其解释为正确的文件格式。