我有一个由合并的PDF制成的PDF。例如,在一个21页的文档中,前5页来自一个文档,然后是3页,然后是3页,再是4页,再是3页,等等。
需要注意的是,每个页面都已正确编号。例如,当查看整个文档的第六页(第二个子文档的第一页)时,Firefox的PDF查看器显示1 (6 of 21)
。之后的页面显示2 (7 of 21)
。
我正在尝试“取消合并”这些PDF。如何获取有关PDF的元数据页面信息,并将较大的文档拆分为正确的部分?
我尝试使用PyPDF2,但是当我得到一个页面,然后获得该页面的页码时,却没有得到该子组号
newpageObj = pdfReader.getPage(6)
print(pdfReader.getPageNumber(newpageObj))
打印“ 6”而不是“ 1”