标签: java pdfbox
我想自动验证/断言每个PDF文件中的某些文本或句子。我有1000个PDF文件需要验证是否存在特定的文本/句子。
答案 0 :(得分:1)
您可以使用Apache Lucene和Apache pdfbox来完成此操作。 请参阅此帖子:http://www.programming-free.com/2012/11/simple-word-search-in-pdf-files-using.html