我在使用grep正则表达式时遇到了一些问题。我正在尝试grep一些ascii编码的十六进制数据,其中字符都是小写的
我的grep声明如下:
grep -E "01[a-f0-9]{2}81[a-f0-9]0" log.log
文件中的大多数匹配看起来都不错,除了有许多匹配如下
010481ec070000
01b481ec070000
01508129070521
我无法弄清楚为什么这些字符串匹配。它们不应该匹配,因为81必须后跟一个十六进制字符,然后是零。
我做了一些进一步的调查。如果我将这三个字符串放在一个单独的文件中,并grep该文件。我没有比赛。不太确定这里发生了什么。
这是grep 2.12。
这是文件中原始数据的一部分。这些都是匹配的行。导出LC_ALL = C后仍然匹配
input data : 011a81a907000b3002004070eaa3d2240fa81272011763dd0040002001
input data : 010481e1070000
input data : 010481ea070000
input data : 011a81a207000b980f0040681f2b11d2f60202dc003669ba0140006100
input data : 014681ab07002140010040d2e457f8c00494ed5e014362bf0240006101ae0500404ee311f402feb2165401c562450240005801db08044068f09ff6a6005af953008062470640004d01
input data : 010481e3070000
input data : 013081ac070016c0000040f6d963fcb4f7e8127c0103637b0140006f01bf0200408ae344fdd2043eed72018362a30240006f01
input data : 010481e4070000
input data : 011a81ad07000b5c06006064f96804901154fed2008e66ff0f4000a401
input data : 010481e5070000
input data : 014681ae070021170d004069f196134cf6a805b4000769b6034000be014e0e004092e80820da0b82fbfa000c6c5c014000bf01880a004020d9ce21f4efd40954011469a1004000ae01
input data : 011a81a607000bef0d0060d60dd6edf8f18e104e015b63d3014000da00
input data : 011a81af07000b4c0800401cfbb0184a0c28f7fa00516931024000e101
input data : 015c81a007002c12050020f2ff640028007afd00801205f70540000400280c00404f016a0a10fbd0012a00e769ff0f400018005d020040e3fabd21e00830f4d200c769d80140000300030a004042030
答案 0 :(得分:0)
尝试使用环境变量LC_ALL=C
执行它。语言环境影响grep
解释字符范围的方式。
答案 1 :(得分:0)
假设命令与你说的完全一样...引号是正确的,在grep获取参数之前没有文件名glob,你没有{0}而不是0等.... / p>
我想知道-a(将二进制文件视为文本)是否是罪魁祸首。二进制输出可以由终端处理。 (这就是我们改变颜色或做诅咒定位或诸如此类的方法。)
如果你有二进制文件删除部分线路怎么办?说控制-H的......
如果您通过 od -c (或者 od -a )管道grep输出会发生什么? od -ta 如果你有的话。)
如果将输出存储在一个文件中,用grep拉出一行这样的行,然后用od查看它会怎么样?