生成的utf-8文件在终端中正确显示:
但不是在Firefox或gedit中:
看起来这些角色加倍了奇怪的人物?
文件: http://maestric.com/shared/other/2004_10_14.txt
有什么问题吗?
答案 0 :(得分:2)
似乎是UTF-16。您确定您的语言环境和终端是UTF-8吗?
您是否在文件上尝试了“od”,或者在十六进制查看器中看到它?永远不要相信您的终端,您必须查看字节以确定。
例如
# od -c -x 2004_10_14.txt | head
0000000 \0 H \0 e \0 u \0 r \0 e \0 \0 d \0 e
4800 6500 7500 7200 6500 2000 6400 6500
0000020 \0 \0 d \0 303 251 \0 b \0 u \0 t \0 \0
2000 6400 c300 00a9 0062 0075 0074 0020