我试图逐页阅读pdf内容文本,但是我以前从未使用过PDFBox,我只是使用Autocomplete和Google编写了以下代码。现在,我想获取页面内容。这是一个Android应用程序。
PDFBoxResourceLoader.init(applicationContext)
thread {
val ins = resources.openRawResource(
resources.getIdentifier("file",
"raw", packageName))
debug(TAG, "Loading PDF...")
val document = PDDocument.load(ins)
debug(TAG, "PDF Loaded.")
for (i in 0 until document.numberOfPages) {
val page = document.getPage(i)
debug(TAG, page.hasContents())
}
}
答案 0 :(得分:0)
我相信不需要对此进行解释,因为您可以从此代码段中清楚地理解它。
PDFBoxResourceLoader.init(applicationContext)
thread {
val ins = resources.openRawResource(
resources.getIdentifier("file",
"raw", packageName))
debug(TAG, "Loading PDF...")
val document = PDDocument.load(ins)
debug(TAG, "PDF Loaded.")
val reader = PDFTextStripper()
for (i in 0 until document.numberOfPages) {
reader.startPage = i
reader.endPage = i
val content = reader.getText(document)
debug(TAG, content)
}
}