我写了一个简单的java程序来获取PDF文档的页码。 这适用于我的大多数文档,但它不适用于此文档:
http://web.itu.edu.tr/~pazarci/rtv/TEK_Digital%20Video%20Measurements_25W_14700_3.pdf
代码的片段如下:
document = PDDocument.load(docPath);
System.out.println( docPath + ": " + document.getNumberOfPages() + " pages");
其中docPath指向此文档的本地路径。
程序然后停在这里。它不会退出,也不会打印任何错误消息。它只是停在PDDocument.load()并且不会继续。
答案 0 :(得分:2)
我遇到了同样的问题,所以我使用您提到的PDF向PDFBox工作人员开了一个问题。它位于https://issues.apache.org/jira/browse/PDFBOX-1726。
他们建议我使用PDDocument.loadNoSeq()
代替PDDocument.load()
。它对我有用!
试试这个并告诉我们!