使用sed从文件中删除多字节字符

时间:2010-08-19 11:07:48

标签: sed multibyte

我需要从文件中删除所有多字节字符,我不知道它们是什么,所以我需要覆盖整个范围。

我可以像这样使用grep找到它们: grep -P“[\ x80- \ xFF]”'myfile'

尝试用sed做一个类似的事情,但改为删除它们。

干杯

2 个答案:

答案 0 :(得分:4)

尝试一下:

LANG=C sed 's/[\x80-\xFF]//g' filename

答案 1 :(得分:0)

您可以使用iconv将一种编码转换为另一种编码