我的网站上有几个pdf文件,我想要的是有一个代码html,php或任何其他语言,允许访问者在PDF文件中写一个单词和我的网站搜索,然后得到可点击的结果找到pdf文件的标题和文本短语,当标题被点击时,浏览器将打开此pdf。
答案 0 :(得分:3)
听起来你想要一只PHP蜘蛛:http://www.sphider.eu/
此外,Google自定义搜索也应该能够索引pdfs。
答案 1 :(得分:2)
如果你想自己动手:
将PDF文件更改为可以搜索的内容。
使用XPDF:http://www.foolabs.com/xpdf/about.html
$content = shell_exec('/usr/local/bin/pdftotext '.$filename.' -'); //dash at the end to output content
使用Google自定义搜索或您自己的搜索脚本只搜索您在步骤1中创建的HTML页面。