应用错误收集

时间：2009-04-03 08:21:41

标签： pdf pdf-generation postscript

我正在尝试使用系统来扫描字母并将扫描的位图转换为PDF，目标是获得高分辨率和小的PDF文件大小。

我使用扫描仪进行原型设计，使用GIMP进行位图操作，使用ImageMagick进行位图到PDF的转换。

我的流程如下：

现在为了使图像更好地压缩，我可以使位图更加压缩友好。在此进行实验之前，我想知道PS / PDF如何存储位图。

PS / PDF中的位图是否运行长度编码？然后我通过从位图行中删除单个像素来获得压缩。

您是否有进一步优化的想法？

您是否知道PS / PDF中对位图存储格式的引用？

答案 0 :(得分：1)

PDF支持多种类型的图像压缩，请参阅：http://en.wikipedia.org/wiki/Pdf#Raster_images

我认为您可以使用imagemagick -compress选项指定使用哪一个：http://www.imagemagick.org/script/command-line-options.php#compress

答案 1 :(得分：1)

一些公司（Luratech和CamiNova是我认识的唯一公司）制作PDF格式的“混合光栅内容”模型。这些文件可以在标准的Adobe Reader中查看，但非常非常小 - 与DjVu相当。

“混合光栅内容”意味着它们将图像分割成高分辨率B＆amp; W掩模（硬边缘，线条，字母）和较低分辨率的平滑色调图像（背景图像）。使用双色调压缩算法（可能是JBIG2）存储掩码，使用JP2K（可能）压缩平滑色调图像。

答案 2 :(得分：0)

对于位图，IIRC，PDF使用deflate。但PDF也可以使用更具体的图像压缩算法存储图像，如JPEG（有损），CCITT（无损），JBIG2（有损和无损）和JPX（JPEG2000，有损和无损）。

答案 3 :(得分：0)

Adobe's PDF reference可能是一个很好的起点。从粗略的外观看，它看起来像未压缩的图像存储，但这根本感觉不对。它也可以链接到外部图像，例如JPEG。

答案 4 :(得分：0)

压缩方法通常由创建PDF的工具选择，您可能对此有限制。

如果您有Acrobat 9.0，那么有一个非常好的“隐藏”功能，它允许您在PDF中查看对象树（您对“资源”下的XObject感兴趣）。在http://pdf.jpedal.org/java-pdf-blog/bid/10479/Viewing-PDF-objects

上有一个关于使用它的简短博客