我正在使用“pdfbox”阅读pdf文件;我没有得到pdf文档中的总页数。我不知道为什么会发生这种情况。
try {
parser = new PDFParser(new FileInputStream(file));
parser.parse();
cosDoc = parser.getDocument();
pdfStripper = new PDFTextStripper();
pdDoc = new PDDocument(cosDoc);
for (int i = 1; i <= pdDoc.getDocumentCatalog().getAllPages().size(); i++) {
pdfStripper.setStartPage(i);
pdfStripper.setEndPage(i);
parsedText = pdfStripper.getText(pdDoc);
if(i==11)
System.out.println(parsedText/*.replaceAll("[^A-Za-z0-9. ]+", "")*/);
}
} catch (Exception e) {
e.printStackTrace();
try {
if (cosDoc != null)
cosDoc.close();
if (pdDoc != null)
pdDoc.close();
} catch (Exception e1) {
e.printStackTrace();
}
}
。pdDoc.getDocumentCatalog()getAllPages()大小();是不是给了no.of页面..有人可以帮助我...
答案 0 :(得分:1)
你可能正在寻找的是这种方法
pdDoc.getNumberofPages();
答案 1 :(得分:0)
而不是
cosDoc = parser.getDocument();
...
pdDoc = new PDDocument(cosDoc);
...
...pdDoc.getDocumentCatalog().getAllPages().size()...
呼叫
parser.getPDDocument();
pdDoc.getNumberofPages();