我可以在Eclipse中使用PDFBox吗?
我在运行OS X Yosemite 10.10的MacBook Pro上使用Eclipse Luna Service Release 2(4.4.2)和Java。我的Java程序读取.txt文件并通过正则表达式搜索某些字符串,将它们以各种格式输出到数据库和/或文件。这适用于原始Word文件(转换为.txt),但不适用于PDF文件。输入文件有许多Unicode字符(例如,a̐ā̆̆uṝo y y y y y j j j j j j jjḥḥḥḥḥḥḥḥ。)
我尝试在Eclipse框架中使用一些简单的例程,但每次尝试时,输入文件的读取都会失败。我怀疑PDFBox和Eclipse有不同的I / O约定。
以下简单模型程序在Eclipse中不起作用。我尝试了各种方法来加载文件。
import java.io.File;
import java.io.IOException;
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.pdmodel.PDPage;
public class LoadingExistingDocument {
public static void main(String args[]) throws IOException {
//Loading an existing document
File file = new File("C:/PdfBox_Examples/sample.pdf");
PDDocument document = PDDocument.load(file);
System.out.println("PDF loaded");
//Adding a blank page to the document
document.addPage(new PDPage());
//Saving the document
document.save("C:/PdfBox_Examples/sample.pdf");
//Closing the document
document.close();
}
}
我是否需要将Eclipse中的PDFBox作为插件?
在Eclipse中使用PDFBox的一些建议将不胜感激。