有没有一种方法可以使用Apache PDFBox读取PDF中所有页面的MediaBox Rectangle,而无需解析整个文件?我目前使用以下代码,对于1.5 GB以上的文件,这需要很长时间。
// Can I avoid this 'load()' function which tries to parse the entire PDF
pdfDocument = PDDocument.load(pdfFile, MemoryUsageSetting.setupTempFileOnly())
// I can only use TempFile, instead of main memory, as there are restrictions to memory usage in the application.
// get the page media box
pdfDocument.getPage(1).getMediaBox()