标签: pdf
如何将包含文本的pdf文件转换为我可以搜索的文件?
答案 0 :(得分:2)
我记得前段时间曾使用Apache Lucene来搜索Java中不同类型文档的搜索,其中包括PDF和Word文件。
但是,这个问题完全取决于您正在使用的编程语言,因此如果您不使用Java,则可能需要指定它。
答案 1 :(得分:2)
您可以通过Adobe Reader搜索PDF。
Programmiticaly,您可以通过iText进行搜索。这可以作为Java和.NET库使用。
我相信你会使用pdf parser类。
答案 2 :(得分:1)
我相信TallPDF允许提取文字。