使用正则表达式解析JPEG字节流标记

时间:2017-11-16 20:31:03

标签: python arrays regex parsing jpeg

我正在编写一个python程序来处理JPEG图像中的信息。然而,我无法使用正则表达式来查找JPEG图像中使用的字节标记代码。

例如:图片标记的开头为\xFF\xD8,图片标记的结尾为\xFF\xD9。我尝试使用的模式是:rb'\xFF\xD8(.+?)\xFF\xD9'。那里没有成功。如果我想在字节数组中找到特定字节标记之间的所有内容,我的模式应该是什么?

1 个答案:

答案 0 :(得分:0)

字符串上的'r'前缀表示“忽略反斜杠转义”,因此忽略它们。

这意味着你正在寻找一个前四个字符的字符串,字面意思为r'\','x','F'和'F'

删除r并将任何作为正则表达式一部分的反斜杠加倍,而不是转义以表示二进制字符。