如何通过EXIF / JFIF签名检测JPEG文件?

时间:2018-08-20 13:23:14

标签: python exif jfif

几天前,我asked a question in a different field最终是一个朋友(@emcconville)帮我编写了一个脚本“恢复单个文件中的每个JPEG文件”。 现在,我意识到该程序仅适用于标准“ JFIF”的图像,而无法检索“ EXIF”标准的图像(数码相机拍摄的图像)。

如何更改程序,使其也可以了解Images中的Exif标准? 我不熟悉Python,我也不知道它的功能。

谢谢

import struct

with open('src.bin', 'rb') as f:
    # Calculate file size.
    f.seek(0, 2)
    total_bytes = f.tell()
    # Rewind to beging.
    f.seek(0)
    file_cursor = f.tell()
    image_cursor = 0

    while file_cursor < total_bytes:
        # Can for start of JPEG.
        if f.read(1) == b"\xFF":
            if f.read(3) == b"\xD8\xFF\xE0":
                print("JPEG FOUND!")
                # Backup and find the size of the image
                f.seek(-8, 1)
                payload_size = struct.unpack('<I', f.read(4))[0]
                # Write image to disk
                d_filename = 'image{0}.jpeg'.format(image_cursor)
                with open(d_filename, 'wb') as d:
                    d.write(f.read(payload_size))
                image_cursor += 1
        file_cursor = f.tell()

1 个答案:

答案 0 :(得分:3)

  

EXIF文件的标记为0xffe1,JFIF文件的标记为   0xffe0。因此,所有依赖0xffe0来检测JPEG文件的代码都将   错过所有EXIF文件。 (from here)

所以只需更改

if f.read(3) == b"\xD8\xFF\xE0":

if f.read(3) == b"\xD8\xFF\xE1":

如果要同时检查这两种情况,请不要再使用.read()。而是类似

x = f.read(3)
if x in (b"\xD8\xFF\xE0", b"\xD8\xFF\xE1"):