使用java逐行阅读pdf文件

时间:2015-09-17 10:46:53

标签: java pdf doc

如何使用java逐行读取pdf文件,并在.txt和.doc文件中写入行? 请提及该计划所需的.jar。

1 个答案:

答案 0 :(得分:4)

使用PDFBox

try{
PDDocument document = null; 
document = PDDocument.load(new File("test.pdf"));
document.getClass();
if( !document.isEncrypted() ){
    PDFTextStripperByArea stripper = new PDFTextStripperByArea();
    stripper.setSortByPosition( true );
    PDFTextStripper Tstripper = new PDFTextStripper();
    String st = Tstripper.getText(document);
    System.out.println("Text:"+st);
}
}catch(Exception e){
    e.printStackTrace();
}

您可以从here

下载