我正在尝试使用PyPDF2完整复制PDF,以下代码复制内容但不复制pdf的大纲。
here is a sample pdf并使用以下代码this.get('excel').export([data1, data2], {sheetName: ['Overview', ,Next'], fileName: 'test.xlsx'});
这是我到目前为止的代码。
python test.py <input pdf> <output dest>
答案 0 :(得分:0)
PdfFileWriter
确实有许多复制整个文件的方法:appendPagesFromReader
,cloneReaderDocumentRoot
和cloneDocumentFromReader
。
但是,我也无法使它们正常工作。 ;-)您可能会有更好的运气。
答案 1 :(得分:-1)
可能不是 100% 精确的复制品,但是...
for i in range(input_pdf.getNumPages()): output_pdf.addPage(input_pdf.getPage(i))