应用错误收集

我有一个名为test.dat的文件，它有一个unicode字符，如下所示：

Mu?oz Rivera 
35 Mu�oz Rivera Ave., Apt 1001

我使用以下命令删除unicode字符：

tr -Ac '[\007-\015][\040-\176]' '[\000*]' < test.dat > sample.dat ;  mv  sample.dat test.dat

该命令运行良好，但问题是我的文件格式是UFT-8，但执行命令后，格式转换为ANSI-1252。

我应该在上面显示的命令中做什么修改才能保留字符编码？

我可以像以前一样在命令行中看到输出文件中的数据。但是，如果我使用notepad ++或ultra edit打开处理过的文件（o / p文件），我可以看到不同的格式（在ansi而不是uft-8中）。