从PDF文档提取页面(使用PDFBox)

时间:2018-12-27 23:36:36

标签: pdfbox

我正在尝试将PDF分解成单独的页面。虽然它 从功能上讲,每页pdf的大小几乎等于原始PDF的大小(250MB)。我看到了一些删除参考 注释,其中可能包含指向其他页面/资源的链接。我已经尝试过以下方法,但是没有运气。有人可以让我知道我在做什么错吗?

(下面的代码在Kotlin中)。我也尝试过使用addPage与importPage, 因为以后会创建深层副本。结果相同。

doc.pages.forEachIndexed { idx: Int, p: PDPage ->
  val newDoc = PDDocument()
  val newPage = newDoc.importPage(p)
  newPage.annotations = null
  newPage.resources = null
  newDoc.save("/tmp/$idx.pdf")
  newDoc.close()
}

0 个答案:

没有答案