从文本文件中删除所有十六进制转义码

时间:2015-01-25 08:06:49

标签: regex sed

我有一个70 + MB的XML文件,在整个文本中包含许多十六进制转义码。用较少的文件打开文件我可以看到它们看起来像handoff<A0>&lt;br /&gt;supported device<AO>&nbsp)。 我开始用sed删除它们:

sed -i 's/\xA0//g'

这样可行,但看起来文件中有一系列这些十六进制转义符,所以我最好指定sed的范围来删除所有这些转义。我该如何正确地做到这一点?

0 个答案:

没有答案