这是我获得的csv文件的一行:
<44>“444”,“444”,“SIEGE SOCIAL”,“2568”,“avenue Montbray”,“QuÈbec”,“QC”,“G1V1E8”,“4186520123”问题,当我表示:“QuÈbec”应该是Québec
当我没有定义任何字符集时......魁北克就好了 当我将charset设置为:charset = UTF-8时,结果是:Qu bec
所以问题是,如何定义charset正确的方法来获得正确的重音!
感谢
答案 0 :(得分:0)
字符编码(“charset”)可能是ISO-8859-1,windows-1252或类似的编码,您正在使用根据Mac Roman编码解释数据的程序查看数据。在ISO-8859-1中,“é”是0xE9。解释为Mac Roman,字节0xE9表示“È”。
使用给定的数据,不可能将表示“é”的各种8位编码区分为0xE9(例如ISO-8859-1和ISO-8859-2)。