如何删除所有非ascii字符(字符代码128-255)?

时间:2016-04-17 00:42:52

标签: unix

我最近已经介绍了shell脚本,并且想知道删除所有非ascii字符的实用程序。最值得注意的是如何用它的控制字符替换(1-31)中的ascii字符。

1 个答案:

答案 0 :(得分:0)

以下是如何使用tr命令(翻译字符)

如果你只想保留" ascii chars"除了使用Unix的a.in文件中128到255之间的那些:

cat a.in | tr -cd '\128-\255'

如果你想删除" ascii chars"不在32到255之间:

cat a.in | tr -d '\0-\31' |tr -d '\255-\377'

也许How do I grep for all non-ASCII characters in UNIX的答案也可能有所帮助。