我有一个名为test.dat
的文件,它有一个unicode字符,如下所示:
Mu?oz Rivera
35 Mu�oz Rivera Ave., Apt 1001
我使用以下命令删除unicode字符:
tr -Ac '[\007-\015][\040-\176]' '[\000*]' < test.dat > sample.dat ; mv sample.dat test.dat
该命令运行良好,但问题是我的文件格式是UFT-8,但执行命令后,格式转换为ANSI-1252。
我应该在上面显示的命令中做什么修改才能保留字符编码?
我可以像以前一样在命令行中看到输出文件中的数据。 但是,如果我使用notepad ++或ultra edit打开处理过的文件(o / p文件),我可以看到不同的格式(在ansi而不是uft-8中)。