我正在尝试使用系统来扫描字母并将扫描的位图转换为PDF,目标是获得高分辨率和小的PDF文件大小。
我使用扫描仪进行原型设计,使用GIMP进行位图操作,使用ImageMagick进行位图到PDF的转换。
我的流程如下:
扫描3x8bit颜色,600 DPI, LZW压缩的真彩色TIFF文件 大小约为8 Mb。
使用GIMP将位图转换为索引 图像的典型颜色表为4 到8种颜色。这使得图像更易于压缩。
使用ImageMagick转换 LZW压缩索引的TIFF文件PDF, 每页约500K。
现在为了使图像更好地压缩,我可以使位图更加压缩友好。在此进行实验之前,我想知道PS / PDF如何存储位图。
PS / PDF中的位图是否运行长度编码?然后我通过从位图行中删除单个像素来获得压缩。
您是否有进一步优化的想法?
您是否知道PS / PDF中对位图存储格式的引用?
答案 0 :(得分:1)
PDF支持多种类型的图像压缩,请参阅:http://en.wikipedia.org/wiki/Pdf#Raster_images
我认为您可以使用imagemagick -compress选项指定使用哪一个:http://www.imagemagick.org/script/command-line-options.php#compress
答案 1 :(得分:1)
一些公司(Luratech和CamiNova是我认识的唯一公司)制作PDF格式的“混合光栅内容”模型。这些文件可以在标准的Adobe Reader中查看,但非常非常小 - 与DjVu相当。
“混合光栅内容”意味着它们将图像分割成高分辨率B& W掩模(硬边缘,线条,字母)和较低分辨率的平滑色调图像(背景图像)。使用双色调压缩算法(可能是JBIG2)存储掩码,使用JP2K(可能)压缩平滑色调图像。
答案 2 :(得分:0)
对于位图,IIRC,PDF使用deflate。但PDF也可以使用更具体的图像压缩算法存储图像,如JPEG(有损),CCITT(无损),JBIG2(有损和无损)和JPX(JPEG2000,有损和无损)。
答案 3 :(得分:0)
Adobe's PDF reference可能是一个很好的起点。从粗略的外观看,它看起来像未压缩的图像存储,但这根本感觉不对。它也可以链接到外部图像,例如JPEG。
答案 4 :(得分:0)
压缩方法通常由创建PDF的工具选择,您可能对此有限制。
如果您有Acrobat 9.0,那么有一个非常好的“隐藏”功能,它允许您在PDF中查看对象树(您对“资源”下的XObject感兴趣)。在http://pdf.jpedal.org/java-pdf-blog/bid/10479/Viewing-PDF-objects
上有一个关于使用它的简短博客