PS / PDF如何存储和压缩位图?

时间:2009-04-03 08:21:41

标签: pdf pdf-generation postscript

我正在尝试使用系统来扫描字母并将扫描的位图转换为PDF,目标是获得高分辨率和小的PDF文件大小。

我使用扫描仪进行原型设计,使用GIMP进行位图操作,使用ImageMagick进行位图到PDF的转换。

我的流程如下:

  • 扫描3x8bit颜色,600 DPI, LZW压缩的真彩色TIFF文件 大小约为8 Mb。

  • 使用GIMP将位图转换为索引 图像的典型颜色表为4 到8种颜色。这使得图像更易于压缩。

  • 使用ImageMagick转换 LZW压缩索引的TIFF文件PDF, 每页约500K。

现在为了使图像更好地压缩,我可以使位图更加压缩友好。在此进行实验之前,我想知道PS / PDF如何存储位图。

PS / PDF中的位图是否运行长度编码?然后我通过从位图行中删除单个像素来获得压缩。

您是否有进一步优化的想法?

您是否知道PS / PDF中对位图存储格式的引用?

5 个答案:

答案 0 :(得分:1)

PDF支持多种类型的图像压缩,请参阅:http://en.wikipedia.org/wiki/Pdf#Raster_images

我认为您可以使用imagemagick -compress选项指定使用哪一个:http://www.imagemagick.org/script/command-line-options.php#compress

答案 1 :(得分:1)

一些公司(Luratech和CamiNova是我认识的唯一公司)制作PDF格式的“混合光栅内容”模型。这些文件可以在标准的Adobe Reader中查看,但非常非常小 - 与DjVu相当。

“混合光栅内容”意味着它们将图像分割成高分辨率B& W掩模(硬边缘,线条,字母)和较低分辨率的平滑色调图像(背景图像)。使用双色调压缩算法(可能是JBIG2)存储掩码,使用JP2K(可能)压缩平滑色调图像。

答案 2 :(得分:0)

对于位图,IIRC,PDF使用deflate。但PDF也可以使用更具体的图像压缩算法存储图像,如JPEG(有损),CCITT(无损),JBIG2(有损和无损)和JPX(JPEG2000,有损和无损)。

答案 3 :(得分:0)

Adobe's PDF reference可能是一个很好的起点。从粗略的外观看,它看起来像未压缩的图像存储,但这根本感觉不对。它也可以链接到外部图像,例如JPEG。

答案 4 :(得分:0)

压缩方法通常由创建PDF的工具选择,您可能对此有限制。

如果您有Acrobat 9.0,那么有一个非常好的“隐藏”功能,它允许您在PDF中查看对象树(您对“资源”下的XObject感兴趣)。在http://pdf.jpedal.org/java-pdf-blog/bid/10479/Viewing-PDF-objects

上有一个关于使用它的简短博客