我有一个包含10页的pdf,我需要读取第2到第5页,并结束文本@@end
的出现是否在pdf中,然后将其存储到字符串中然后检查另一个{{ 1}}。
我有以下代码:我在这里使用pdfbox
@@end
它只允许我阅读整个pdf并将其存储到PDDocument pddDocument=PDDocument.load(new File("sample.pdf"));
PDFTextStripper textStripper=new PDFTextStripper();
String text = textStripper.getText(pddDocument).toString();
。我需要的是阅读第2页到第5页的pdf并检查String text
的出现情况,然后进行一些操作,如下所示
@@end
请指导一下?
答案 0 :(得分:1)
"秘密"是
textStripper.setStartPage(p);
textStripper.setEndPage(p);
因此您只需执行此类操作(页面为零):
for (int p = 1; p <= 4; ++p)
{
stripper.setStartPage(p);
stripper.setEndPage(p);
String text = textStripper.getText(pddDocument);
if (text.contains("@@end"))
// do stuff
}