PDF格式的每页信息规范(XMP)

时间:2017-08-23 12:30:38

标签: pdf imagemagick specifications xmp

我从N张图片创建一张PDF。使用此命令行很容易和直截了当:

convert front1.png back1.png front2.png back2.png result.pdf

不幸的是,在此过程中会丢失一些信息。文件result.pdf有四个页面,但不清楚它是否包含两个前后页面,或者它是否包含前页。

我想将此信息存储在已创建的result.pdf的元数据中。

是否有以PDF格式存储前/后信息的官方标准?

我试图在这里找到一些内容,但无法找到相关信息:http://www.adobe.com/products/xmp/standards.html

3 个答案:

答案 0 :(得分:4)

http://www.adobe.com/content/dam/Adobe/en/devnet/acrobat/pdfs/pdf_reference_1-7.pdf

查看pdf规范(1.7)

在第580页(在交互式功能下),它列出您可以设置双工和单工等首选项。

我不知道使用ImageMagick是否可行。 我知道可以使用iText。

请参阅此问题:Printing a PDF duplex using Java

答案 1 :(得分:3)

就PDF格式而言,页面是页面:它们不是  真正被认为是“前线”或者'回来'

当页面被光栅化到一张物理纸上,即打印时,这个概念才有意义。

这并不意味着PDF完全不了解这个概念。

有几种方法可以发挥作用:

  • PDF可以带有一个内部指示器,指示文档是否打算以双面打印(有几个选项, 正如Joris的答案所述。但是,这些只是 对您发送的打印系统的建议。没有 保证给定的打印系统真正尊重 以您期望的方式设置和放置纸张两面的页面。
  • PDF的内容可以布局,就像它要打印双面打印一样(例如镜像页面布局等)。但这只是内容流的一部分; PDF格式本身是不可知的(除了上面提到的选项)。

所以很难说一个特定的页面是“前面的'或者'回来'您可以检查是否设置了双面打印标记,如果设置了,则取出页码并除以2:如果它是偶数则是首页,如果是奇数则是后页(请记住,页面编号在PDF格式中以零开头。

但仍然存在边缘情况。

例如,如果您要打印一个范围(例如第3-7页),并且您希望第3页成为'返回'页面,打印机的第一页可能不会在它的前面空白并且背面有第3页(这是你对我上面建议的期望)。

大多数打印机都会从第一张纸的正面开始,而您的正面纸张将从第一张纸的正面开始。和'回来'页面将无序。

答案 2 :(得分:0)

另一种方法是使用文章:PDF参考文献v1.7中的第8.3.2节。你可以有两篇文章,一篇用于首页,另一篇用于背页。

PDF参考v1.7 - 8.3.2:“某些类型的文档可能包含逻辑连接但不是物理连续的内容项序列”。