什么是charset是好的

时间:2013-11-29 19:58:51

标签: browser character-encoding

这是我获得的csv文件的一行:

<44>“444”,“444”,“SIEGE SOCIAL”,“2568”,“avenue Montbray”,“QuÈbec”,“QC”,“G1V1E8”,“4186520123”

问题,当我表示:“QuÈbec”应该是Québec

当我没有定义任何字符集时......魁北克就好了 当我将charset设置为:charset = UTF-8时,结果是:Qu bec

所以问题是,如何定义charset正确的方法来获得正确的重音!

感谢

1 个答案:

答案 0 :(得分:0)

字符编码(“charset”)可能是ISO-8859-1,windows-1252或类似的编码,您正在使用根据Mac Roman编码解释数据的程序查看数据。在ISO-8859-1中,“é”是0xE9。解释为Mac Roman,字节0xE9表示“È”。

使用给定的数据,不可能将表示“é”的各种8位编码区分为0xE9(例如ISO-8859-1和ISO-8859-2)。