应用错误收集

我有一个由合并的PDF制成的PDF。例如，在一个21页的文档中，前5页来自一个文档，然后是3页，然后是3页，再是4页，再是3页，等等。

需要注意的是，每个页面都已正确编号。例如，当查看整个文档的第六页（第二个子文档的第一页）时，Firefox的PDF查看器显示1 (6 of 21)。之后的页面显示2 (7 of 21)。

我正在尝试“取消合并”这些PDF。如何获取有关PDF的元数据页面信息，并将较大的文档拆分为正确的部分？

我尝试使用PyPDF2，但是当我得到一个页面，然后获得该页面的页码时，却没有得到该子组号 newpageObj = pdfReader.getPage(6) print(pdfReader.getPageNumber(newpageObj)) 打印“ 6”而不是“ 1”