我有一个ISO-8859-1编码的文本文件。我需要它utf-8编码。
Firefox正确显示引号和单引号字符,但gedit没有:
火狐:
对于家得宝?
“当然,”他当时说道。
Home Depot表示纳德利的决定是
的gedit:
对于家得宝?
Â绝对地,他当时说。
Home Depot表示纳德利的决定
我试过了:
iconv -f ISO-8859-1 -t UTF-8 Bus16451112.txt > iconv.txt
和
recode ISO-8859-1..UTF-8 Bus16451112.txt
两者都不起作用。在转换之后,firefox也会显示错误的字符,无论我选择utf-8(绝对,他当时说过。)或ISO-8859-1(“绝对,”他当时说过。)在视图菜单中
我需要做些什么才能将此文件转换为UTF-8,以便正确显示?
答案 0 :(得分:2)
您的文本文件肯定不会在ISO-8859-1中编码,因为该字符集不包含印刷引号字符。编码可能是Windows-1252,它将ISO-8859-1的某些控制字符替换为其他更有用的字符。您应该可以使用iconv将其转换为:
iconv -f Windows-1252 -t UTF-8 q8402932.txt > iconv.txt