由于奇怪的sed行为而S之以鼻,其中仅识别HEX序列的一部分:
有一个我要修复的带有奇怪字符的字符串,当尝试十六进制替换sed时,它只能找到前三个字符。
xxd
的字符串输出有问题的字符:
6965 7261 f480 8488 6e6f 7761 6e61 2031 iera....nowana 1
我想用可打印的字符替换此序列f480 8488
,但sed只能识别前三个:
sed 's/\xf4\x80\x84/00/g' | xxd
6965 7261 3030 886e 6f77 616e 6120 3136 iera00.nowana 16
f480 84
已正确替换为3030
但是
sed 's/\xf4\x80\x84\x88/00/g' | xxd
6965 7261 f480 8488 6e6f 7761 6e61 2031 iera....nowana 1
找不到f480 8488
如果我在两个sed语句上中断sed 's/\xf4\x80/0/g' | sed 's/\x84\x88/0/g'
,一切都很好
我会理解它是否正在寻找配对,但是为什么依次只三个而不是四个字符?
答案 0 :(得分:0)
在@tripleee发表评论并通过@ the.Legend确认解决方案
设置LC_ALL=C
是有效的解决方案。
here有据可查。
它强制应用程序使用默认语言进行输出:
$ LC_ALL=es_ES man ¿Qué página de manual desea? $ LC_ALL=C man What manual page do you want?