如何在Python中确定常见图像类型的类型和大小?

时间:2013-12-14 12:25:55

标签: python image image-processing

我正在开发一套用于处理Microsoft Office Open XML文档的库。在Word和PowerPoint文档中嵌入图片的过程中,我需要确定图像的MIME类型和像素尺寸这样的标题细节,dpi也不错。

目前我正在使用Pillow来做到这一点,但是作为依赖关系,它并不理想。我只对库使用了几个语句,但依赖性要求人们有一个C编译器和像libjpeg这样的图像库。这使得安装在Windows上尤其具有挑战性,尽管即使在OS X上它也比我想要的更多。

有没有办法可以通过纯Python成像库获得基础知识,或者只是将一个相当简单的模块与我的发行版合并?

1 个答案:

答案 0 :(得分:3)

首先,使用Pillow可能是最好的解决方案,尤其是因为你可以download windows binaries from pypi

快速谷歌搜索导致this pure-python function获得GIF,PNG和JPEG图片的大小:

import struct
from cStringIO import StringIO


def get_image_info(data):
    """
    Return (content_type, width, height) for a given img file content
    no requirements
    """
    data = str(data)
    size = len(data)
    height = -1
    width = -1
    content_type = ''

    # handle GIFs
    if (size >= 10) and data[:6] in ('GIF87a', 'GIF89a'):
        # Check to see if content_type is correct
        content_type = 'image/gif'
        w, h = struct.unpack("<HH", data[6:10])
        width = int(w)
        height = int(h)

    # See PNG 2. Edition spec (http://www.w3.org/TR/PNG/)
    # Bytes 0-7 are below, 4-byte chunk length, then 'IHDR'
    # and finally the 4-byte width, height
    elif ((size >= 24) and data.startswith('\211PNG\r\n\032\n')
          and (data[12:16] == 'IHDR')):
        content_type = 'image/png'
        w, h = struct.unpack(">LL", data[16:24])
        width = int(w)
        height = int(h)

    # Maybe this is for an older PNG version.
    elif (size >= 16) and data.startswith('\211PNG\r\n\032\n'):
        # Check to see if we have the right content type
        content_type = 'image/png'
        w, h = struct.unpack(">LL", data[8:16])
        width = int(w)
        height = int(h)

    # handle JPEGs
    elif (size >= 2) and data.startswith('\377\330'):
        content_type = 'image/jpeg'
        jpeg = StringIO(data)
        jpeg.read(2)
        b = jpeg.read(1)
        try:
            while (b and ord(b) != 0xDA):
                while (ord(b) != 0xFF): b = jpeg.read
                while (ord(b) == 0xFF): b = jpeg.read(1)
                if (ord(b) >= 0xC0 and ord(b) <= 0xC3):
                    jpeg.read(3)
                    h, w = struct.unpack(">HH", jpeg.read(4))
                    break
                else:
                    jpeg.read(int(struct.unpack(">H", jpeg.read(2))[0])-2)
                b = jpeg.read(1)
            width = int(w)
            height = int(h)
        except struct.error:
            pass
        except ValueError:
            pass

    return content_type, width, height

请注意,该博客上的代码是由EmmanuelVAÏSSE编写的。他的博客上没有指定许可证,因此取决于您希望包含您可能想要重新实现该功能的代码的位置,或者要求他访问安全网站。