utf-8文件显示加倍的字符

时间:2010-10-07 18:12:15

标签: linux unicode

生成的utf-8文件在终端中正确显示: alt text

但不是在Firefox或gedit中: alt text

看起来这些角色加倍了奇怪的人物?

文件: http://maestric.com/shared/other/2004_10_14.txt

有什么问题吗?

1 个答案:

答案 0 :(得分:2)

似乎是UTF-16。您确定您的语言环境和终端是UTF-8吗?

您是否在文件上尝试了“od”,或者在十六进制查看器中看到它?永远不要相信您的终端,您必须查看字节以确定。

例如

# od -c -x 2004_10_14.txt  | head
0000000  \0   H  \0   e  \0   u  \0   r  \0   e  \0      \0   d  \0   e
        4800 6500 7500 7200 6500 2000 6400 6500
0000020  \0      \0   d  \0 303 251  \0   b  \0   u  \0   t  \0      \0
        2000 6400 c300 00a9 0062 0075 0074 0020