如何让TECSniffTextEncoding
区分UTF-8,UTF-16和UTF-32?我试图用它来确定文本文件的编码,但它总是返回UTF-8,即使是实际上是UTF-16和UTF-32的文件(我也尝试过大而小的文件)端)。
我已经尝试确保为最大错误和功能计数提供足够大的数字,但这似乎没有任何效果。实际上,即使对于正确的编码,在每种情况下都会出现令人惊讶的大量错误。
我通过使用TextEdit保存文件并指定编码来创建文件。我通过在TextWrangler中打开它们来验证它们。
这里是单元测试和测试文件的提交: https://github.com/Uncommon/Xit/commit/7b2251d9b5f96098317dd7ab02b6bc43a516953b