在给定输入作为开始和结束页码的情况下逐行阅读pdf页面 - pdfbox java

时间:2014-12-30 05:29:35

标签: java pdf pdfbox

我有一个包含10页的pdf,我需要读取第2到第5页,并结束文本@@end的出现是否在pdf中,然后将其存储到字符串中然后检查另一个{{ 1}}。

我有以下代码:我在这里使用pdfbox

@@end

它只允许我阅读整个pdf并将其存储到PDDocument pddDocument=PDDocument.load(new File("sample.pdf")); PDFTextStripper textStripper=new PDFTextStripper(); String text = textStripper.getText(pddDocument).toString(); 。我需要的是阅读第2页到第5页的pdf并检查String text的出现情况,然后进行一些操作,如下所示

@@end

请指导一下?

1 个答案:

答案 0 :(得分:1)

"秘密"是

textStripper.setStartPage(p);
textStripper.setEndPage(p);

因此您只需执行此类操作(页面为零):

for (int p = 1; p <= 4; ++p)
{
    stripper.setStartPage(p);
    stripper.setEndPage(p);
    String text = textStripper.getText(pddDocument);
    if (text.contains("@@end"))
        // do stuff
}