意大利语检测为iso-8859-2

时间:2012-10-10 15:27:18

标签: python encoding chardet

我正在使用chardet来检测包括意大利语在内的文本文件的编码。问题是它一直检测到它们的编码为iso-8859-2,而正确的检测是iso-8859-1。有人知道修复吗? 我的当地语言是波兰语?这会影响检测吗?

1 个答案:

答案 0 :(得分:1)

chardet不支持iso-8859-1,这就是为什么它没有检测到它。 有关支持的字符编码,请参阅chardets主页 - http://pypi.python.org/pypi/chardet

我使用Linux程序'file'来获取不同内容的字符编码,但是我不确定它有多安全,请参阅我的问题 - Encoding detection in Python, use the chardet library or not?。但到目前为止,它对我来说效果很好。

不过,您的当地语言不应影响检测。