如何在不解析整个文件的情况下获取PDF页面的MediaBox?

时间:2019-05-02 00:54:09

标签: apache pdfbox

有没有一种方法可以使用Apache PDFBox读取PDF中所有页面的MediaBox Rectangle,而无需解析整个文件?我目前使用以下代码,对于1.5 GB以上的文件,这需要很长时间。

// Can I avoid this 'load()' function which tries to parse the entire PDF
pdfDocument = PDDocument.load(pdfFile, MemoryUsageSetting.setupTempFileOnly())

// I can only use TempFile, instead of main memory, as there are restrictions to memory usage in the application.
// get the page media box
pdfDocument.getPage(1).getMediaBox()

0 个答案:

没有答案