无法将pdf文件转换为我可以搜索的pdf文件

时间:2009-03-16 15:51:56

标签: pdf

如何将包含文本的pdf文件转换为我可以搜索的文件?

3 个答案:

答案 0 :(得分:2)

我记得前段时间曾使用Apache Lucene来搜索Java中不同类型文档的搜索,其中包括PDF和Word文件。

但是,这个问题完全取决于您正在使用的编程语言,因此如果您不使用Java,则可能需要指定它。

答案 1 :(得分:2)

您可以通过Adobe Reader搜索PDF。

Programmiticaly,您可以通过iText进行搜索。这可以作为Java和.NET库使用。

我相信你会使用pdf parser类。

答案 2 :(得分:1)

我相信TallPDF允许提取文字。