由于PdfBox在android中不起作用(因为它使用了Android上不支持的一些AWT组件)。有人在这个网站上向我建议过。所以,我使用了TomRoush/PdfBox-Android
现在我像这样阅读pdf
public void readPdf(File pdfFile) {
try {
PDFBoxResourceLoader.init(getApplicationContext());
PDDocument document = PDDocument.load(pdfFile);
PDFTextStripper stripper = new PDFTextStripper();
stripper.setStartPage(1);
String text = stripper.getText(document);
Log.d("location", text);
} catch (IOException e) {
e.printStackTrace();
Log.d("location", e.toString());
}
}
但是这给了我整个PDF作为String
。我想要的是每个段落或文章的字符串。