org.apache.pdfbox.pdmodel.PDDocument不加载/读取PDF文档

时间:2013-06-03 00:58:25

标签: java pdfbox

我写了一个简单的java程序来获取PDF文档的页码。 这适用于我的大多数文档,但它不适用于此文档:

http://web.itu.edu.tr/~pazarci/rtv/TEK_Digital%20Video%20Measurements_25W_14700_3.pdf

代码的片段如下:

    document = PDDocument.load(docPath);
    System.out.println( docPath + ": " + document.getNumberOfPages() + " pages");

其中docPath指向此文档的本地路径。

程序然后停在这里。它不会退出,也不会打印任何错误消息。它只是停在PDDocument.load()并且不会继续。

1 个答案:

答案 0 :(得分:2)

我遇到了同样的问题,所以我使用您提到的PDF向PDFBox工作人员开了一个问题。它位于https://issues.apache.org/jira/browse/PDFBOX-1726

他们建议我使用PDDocument.loadNoSeq()代替PDDocument.load()。它对我有用!

试试这个并告诉我们!