PDF解析器文本包含

时间:2016-01-21 07:37:53

标签: java selenium-webdriver pdfbox

我想使用TestNG和PDFBox验证PDF文档。

我想问,PDF是否可以检查包含这样的文字:

PDFParser parser =  new PDFParser(stream);
parser.getDocument().conntains("ABC")

1 个答案:

答案 0 :(得分:1)

尝试以下代码: -

  public void ReadPDF() throws Exception {
    URL TestURL = new URL("http://www.axmag.com/download/pdfurl-guide.pdf");

    BufferedInputStream TestFile = new BufferedInputStream(TestURL.openStream());
    PDFParser TestPDF = new PDFParser(TestFile);
    TestPDF.parse();
    String TestText = new PDFTextStripper().getText(TestPDF.getPDDocument());

    Assert.assertTrue(TestText.contains("Open the setting.xml, you can see it is like this"));

    }

下载图书馆: - https://pdfbox.apache.org/index.html