我一直在尝试运行apache提供的pdf2text工具。我最初得到'未能加载主类清单属性'错误。所以我修改了jar中的清单文件以包含Main-Class属性。把它写成 -
Main-Class: org.apache.pdfbox.ExtractText
但在此之后,我得到了例外 -
Exception in thread "main" java.io.FileNotFoundException:
org.apache.pdfbox.ExtractText (No such file or directory)
at java.io.FileInputStream.open(Native Method)
at java.io.FileInputStream.<init>(FileInputStream.java:106)
at java.io.FileInputStream.<init>(FileInputStream.java:66)
at org.apache.pdfbox.pdmodel.PDDocument.load(PDDocument.java:978)
at org.apache.pdfbox.ExtractText.startExtraction(ExtractText.java:196)
at org.apache.pdfbox.ExtractText.main(ExtractText.java:76)
这可能是什么错误?
答案 0 :(得分:0)
尝试切换到此入口点(Main-class):
org.apache.pdfbox.PDFBox
编辑:此设置也应该有用(如果你想提取文字)
java -cp ./pdfbox-1.6.0.jar org.apache.pdfbox.PDFBox ExtractText some.pdf
注意您需要将Apache的日志包等添加到CLASSPATH变量中,除非您在命令行中也设置了它..