如何验证数千个PDF文件中的文本/内容

时间:2015-07-27 09:51:14

标签: java pdfbox

我想自动验证/断言每个PDF文件中的某些文本或句子。我有1000个PDF文件需要验证是否存在特定的文本/句子。

1 个答案:

答案 0 :(得分:1)

您可以使用Apache Lucene和Apache pdfbox来完成此操作。 请参阅此帖子:http://www.programming-free.com/2012/11/simple-word-search-in-pdf-files-using.html