我上传了一个PDF文件的文件,我想在上传的
中搜索包含的特定单词在php中仅使用grep命令的文件。
提前致谢。
答案 0 :(得分:2)
您可以使用pdfgrep查看此链接How to search contents of multiple pdf files?我也使用过几次,它也支持递归搜索。
谢谢&问候,
Alok Thaker
答案 1 :(得分:2)
正如Amal Murali在评论中所写,您必须将PDF内容转换为文本。这已在StackOverflow中解决,即How to extract text from the PDF document?。 然后你可以使用preg_match_all,或者如果你真的想使用grep,你可以使用一些东西作为proc_open并通过管道传递文本。
所以,使用http://pastebin.com/hRviHKp1中的类(文章链接),这是一个preg_match_all的例子:
include('class.pdf2text.php');
$a = new PDF2Text();
$a->setFilename('Videographer_RFP.pdf');
$a->decodePDF();
preg_match_all ('some pattern', $a->output(), $matches);
print_r($matches);
请注意,我尚未测试代码。