使用sed编辑PDF属性

时间:2014-01-16 17:25:22

标签: python pdf sed notepad++ blender

我正在尝试为blender开发一个python脚本,以将渲染的图像序列输出到PDF。我正在使用Imagemagick转换为PDF,该部分工作正常,但是,我希望缩略图预览也包含在PDF中。

PDF格式对我来说有点混乱,但我找到了/PageMode/UseThumbs标签以及如何将它们正确插入文件中。我可以手动完成这项工作,效果非常好。但是我一直试图获得类似的结果,而不需要手动完成,毕竟我正在写一个脚本。以下是PDF中标题数据的示例摘录,其中添加了标记:

%PDF-1.3 
1 0 obj
<<
/Pages 2 0 R
/PageMode
/UseThumbs
/Type /Catalog
>>
endobj
2 0 obj
<<
/Type /Pages
/Kids [ 3 0 R 17 0 R 31 0 R ]
/Count 3
>>

我正在尝试使用sed在第4行和第5行根据需要插入标记,这也有效,但是当我打开PDF时,图像已损坏。加密地,当我将手动编辑的PDF(未损坏的PDF)与记事本++中的sed编辑的PDF(已损坏的)进行比较时,我可以找到的文件没有区别。有不同的字符数,但我找不到差异的位置

据我所知,PDF有一个偏移的交叉引用表,但我觉得手工操作不会破坏任何东西,但用sed做它会造成损坏

我做错了什么?

1 个答案:

答案 0 :(得分:2)

你真的不想从sed这样做。有些PDF可能看起来像面向行的文本文件,但它们肯定不是。

由于您已经在使用Python,因此可以使用Python库来完成此任务。

pdfrw将从纯Python中为您做到这一点。它将在PDF文件中啜饮,并使用您想要的任何更改重建它并正确设置文件偏移量。以下代码片段应将/ PageMode设置为PDF的/ Root字典中的/ UseThumbs:

    from pdfrw import PdfReader, PdfWriter, PdfName

    trailer = PdfReader('myfile.pdf')
    trailer.Root.PageMode = PdfName.UseThumbs
    PdfWriter().write('mynewfile.pdf', trailer)

免责声明:我是pdfrw作者。