标签: sed multibyte
我需要从文件中删除所有多字节字符,我不知道它们是什么,所以我需要覆盖整个范围。
我可以像这样使用grep找到它们: grep -P“[\ x80- \ xFF]”'myfile'
尝试用sed做一个类似的事情,但改为删除它们。
干杯
答案 0 :(得分:4)
尝试一下:
LANG=C sed 's/[\x80-\xFF]//g' filename
答案 1 :(得分:0)
您可以使用iconv将一种编码转换为另一种编码