搜索PDF文件中包含1000页以上的文本

时间:2014-09-15 04:18:22

标签: javascript php pdf tcpdf fpdf

我正在开发一个网站。我想在pdf文件中搜索搜索字符串并在网站上显示结果。 PDF文件可用,当用户输入一些文本进行搜索时,应显示结果。我试过" pdf对象"这不是我想要做的事情。我的需要是不要在网站上查看pdf,而是搜索pdf。

1 个答案:

答案 0 :(得分:1)

Libpoppler可以提供帮助。它解析PDF。

使用Libpoppler提供了pdftotext命令行实用程序,它可能适合您的目的(它来自Debian软件包poppler-utils中的其他程序)。然而,更好的可能是pdfgrep,一种在PDF文件中搜索文本的工具,这是Libpoppler没有的。所有这些都可以在Debian中找到,也许在其他地方可用。