Question

我正在尝试使用PyPDF2完整复制PDF，以下代码复制内容但不复制pdf的大纲。

here is a sample pdf并使用以下代码this.get('excel').export([data1, data2], {sheetName: ['Overview', ,Next'], fileName: 'test.xlsx'});

这是我到目前为止的代码。

python test.py <input pdf> <output dest>

Answer 1

PdfFileWriter确实有许多复制整个文件的方法：appendPagesFromReader，cloneReaderDocumentRoot和cloneDocumentFromReader。

但是，我也无法使它们正常工作。 ;-)您可能会有更好的运气。

Answer 2

可能不是 100% 精确的复制品，但是...

for i in range(input_pdf.getNumPages()): output_pdf.addPage(input_pdf.getPage(i))