文件编码结果因nkf和文件而异。哪个是值得信赖的?
$ nkf -g test
EUC-JP
$ file -I test
test: text/plain; charset=utf-8
这是文件内容。
$ cat test
Móviles
所以,我用nkf将其编码转换为utf-8并得到了乱码。
$ nkf -w test
M坦viles
所以,这个文件好像是 EUC-JP 。但为什么文件命令会将其显示为 utf-8 ?
答案 0 :(得分:1)
猜测文件编码没有完美的方法,因为这个答案显示: https://unix.stackexchange.com/a/11648
要转换文件,请尝试以下
iconv -f ENCODING_IN -t ENCODING_OUT(UTF-8) FILE_IN > FILE_OUT