sed仅识别HEX序列的一部分

时间:2019-05-26 11:41:50

标签: linux sed hex locale

由于奇怪的sed行为而S之以鼻,其中仅识别HEX序列的一部分:

有一个我要修复的带有奇怪字符的字符串,当尝试十六进制替换sed时,它只能找到前三个字符。

xxd的字符串输出有问题的字符:

6965 7261 f480 8488 6e6f 7761 6e61 2031 iera....nowana 1

我想用可打印的字符替换此序列f480 8488,但sed只能识别前三个:

sed 's/\xf4\x80\x84/00/g' | xxd
6965 7261 3030 886e 6f77 616e 6120 3136  iera00.nowana 16

f480 84已正确替换为3030

但是

sed 's/\xf4\x80\x84\x88/00/g' | xxd
6965 7261 f480 8488 6e6f 7761 6e61 2031  iera....nowana 1

找不到f480 8488

如果我在两个sed语句上中断sed 's/\xf4\x80/0/g' | sed 's/\x84\x88/0/g',一切都很好

我会理解它是否正在寻找配对,但是为什么依次只三个而不是四个字符?

1 个答案:

答案 0 :(得分:0)

在@tripleee发表评论并通过@ the.Legend确认解决方案

设置LC_ALL=C是有效的解决方案。 here有据可查。

  

它强制应用程序使用默认语言进行输出:

 $ LC_ALL=es_ES man 
 ¿Qué página de manual desea?

 $ LC_ALL=C man 
 What manual page do you want?