html / php在多个PDF文件中搜索文本

时间:2012-09-19 18:53:37

标签: php html cakephp pdf

我的网站上有几个pdf文件,我想要的是有一个代码html,php或任何其他语言,允许访问者在PDF文件中写一个单词和我的网站搜索,然后得到可点击的结果找到pdf文件的标题和文本短语,当标题被点击时,浏览器将打开此pdf。

2 个答案:

答案 0 :(得分:3)

听起来你想要一只PHP蜘蛛:http://www.sphider.eu/

此外,Google自定义搜索也应该能够索引pdfs。

答案 1 :(得分:2)

如果你想自己动手:

  1. 将PDF文件更改为可以搜索的内容。

    使用XPDF:http://www.foolabs.com/xpdf/about.html

    $content = shell_exec('/usr/local/bin/pdftotext '.$filename.' -'); //dash at the end to output content
    

    另外。 http://coolwanglu.github.com/pdf2htmlEX/

  2. 使用Google自定义搜索或您自己的搜索脚本只搜索您在步骤1中创建的HTML页面。