运行pdf2text jar时出现问题。找不到文件异常

时间:2011-08-18 07:07:41

标签: java apache filenotfoundexception

我一直在尝试运行apache提供的pdf2text工具。我最初得到'未能加载主类清单属性'错误。所以我修改了jar中的清单文件以包含Main-Class属性。把它写成 -

Main-Class: org.apache.pdfbox.ExtractText

但在此之后,我得到了例外 -

Exception in thread "main" java.io.FileNotFoundException: 
        org.apache.pdfbox.ExtractText (No such file or directory)
        at java.io.FileInputStream.open(Native Method)
        at java.io.FileInputStream.<init>(FileInputStream.java:106)
        at java.io.FileInputStream.<init>(FileInputStream.java:66)
        at org.apache.pdfbox.pdmodel.PDDocument.load(PDDocument.java:978)
        at org.apache.pdfbox.ExtractText.startExtraction(ExtractText.java:196)
        at org.apache.pdfbox.ExtractText.main(ExtractText.java:76)

这可能是什么错误?

1 个答案:

答案 0 :(得分:0)

尝试切换到此入口点(Main-class):

org.apache.pdfbox.PDFBox

编辑:此设置也应该有用(如果你想提取文字)

java -cp ./pdfbox-1.6.0.jar org.apache.pdfbox.PDFBox ExtractText some.pdf

注意您需要将Apache的日志包等添加到CLASSPATH变量中,除非您在命令行中也设置了它..