TECSniffTextEncoding总是说UTF-8

时间:2016-05-24 14:47:18

标签: macos unicode utf-8 utf-16

如何让TECSniffTextEncoding区分UTF-8,UTF-16和UTF-32?我试图用它来确定文本文件的编码,但它总是返回UTF-8,即使是实际上是UTF-16和UTF-32的文件(我也尝试过大而小的文件)端)。

我已经尝试确保为最大错误和功能计数提供足够大的数字,但这似乎没有任何效果。实际上,即使对于正确的编码,在每种情况下都会出现令人惊讶的大量错误。

我通过使用TextEdit保存文件并指定编码来创建文件。我通过在TextWrangler中打开它们来验证它们。

这是主要代码: https://github.com/Uncommon/Xit/blob/7b2251d9b5f96098317dd7ab02b6bc43a516953b/Xit/NSData%2BEncoding.m

这里是单元测试和测试文件的提交: https://github.com/Uncommon/Xit/commit/7b2251d9b5f96098317dd7ab02b6bc43a516953b

0 个答案:

没有答案