二进制文件的正则表达式

时间:2014-05-11 23:27:35

标签: python regex binaryfiles binary-data

如何使用正则表达式解析二进制文件?

到目前为止我有什么

import re

format = re.compile() <--

f.open("input.dat", "rb")

for line in f.readlines():
    data = re.search(format, line)

我不知道在编译中放什么,因为我只习惯为字符串编写正则表达式。

具体而言,我希望将格式分解为:

2个字节,2个字节,18个字节

2 个答案:

答案 0 :(得分:3)

如果你已经知道文件的二进制结构,那么struct unpack就是你的朋友。

答案 1 :(得分:0)

我不确定我理解为什么要用正则表达式解析二进制文件。

您是说要继续以2-2-18字节块的形式解析字节?在这种情况下,为什么不使用标准IO方法读取那么多字节?