PDF压缩Adobe如何做到这一点?

时间:2009-11-11 22:16:21

标签: pdf filesize docx

这是一个有趣的问题,而不是一个严肃的问题,但Adobe PDF格式如何使文档如此便携?

我刚创建了一个大小为235kb的Word文档,其中包含多张彩色照片和一些文字短语。使用CutePDF创建的PDF(我理解的不是最有效的PDF创建方法)只有176kb。那是25%的压缩率。当这些文件放入压缩文件夹时,PDF可以进行3%压缩,其中.docx只能占2%。我确信较大的文件在大小上会有更大的差异。

我的问题是,Adobe如何设法让他们的文件变小?我知道它们是从光栅图形中提取的,但我的3位图文件确实无法从光栅中获得帮助,可以吗?

3 个答案:

答案 0 :(得分:3)

有几种方法可以压缩它:

  1. Pdf文件使用lzw和zip压缩。

  2. 如果图像在文档中缩放,或者磁盘上的dpi大于cutepdf中允许的大小(例如,如果cutepdf设置为300dpi且图像为600 dpi),则可以缩放在pdf。

  3. Microsoft以docx格式存储大量信息,格式为xml。比输出信息真的需要更多(例如,尝试将文本复制并粘贴到文本框单元格中,然后查看出来的html信息 - 我对cms的文本框大小有限制,并且一个7字的句子膨胀到950个字符)。这样就可以在以后进行编辑,并提供大量深奥信息,以确保一切都在每个可能的排列中正确显示。 pdf不需要这些信息,所以它可以只做字体和大小,并删除所有不必要的信息,节省大量空间。

答案 1 :(得分:3)

如果您有Acrobat 9,则内置一个很好的工具,这样您就可以看到PDF是如何组合在一起的(并且使用了压缩)。有一篇博客文章解释了如何在http://pdf.jpedal.org/java-pdf-blog/bid/10479/Viewing-PDF-objects

使用它

答案 2 :(得分:1)

当您使用这些小文件时,文档格式的任何开销都会产生不成比例的影响,这就是您看到如此大的差异的原因。

我拍了2683KB的JPEG并将其插入到一个新的单词2003文档中。生成的.doc文件为2725KB(或作为docx的2697KB)。把它变成PDF给了我一个2701KB的PDF。所以我看到25KB的差异,但由于图像数据的大小,差异只有1%左右。它大约是你得到的一半,但是在制作docx时,你所拥有的单词版本可能更加冗长?

对于PDF,acrobat显示空间使用为2691K图像,8.27K开销和1K字体。 PDF在语法上是一种非常稀疏的格式,它限制了开销,而且大部分都有重复的字符串,因此很容易压缩。

如果您想在树状视图中查看PDF包含的内容,可以下载CosEdit的演示版。