如何搜索多个pdf文件的内容并返回pdf的文件名?

时间:2012-06-16 22:12:38

标签: linux pdf full-text-search grep debian

我在这里搜索了一下,找到了这个:

find /path -name '*.pdf' -exec pdftotext {} - \; | grep "your query"

但是,它会返回包含“您的查询”的pdf文件中的文本块。有一种方法可以返回文件名吗?

2 个答案:

答案 0 :(得分:2)

正如Neil所说:你可以使用-l选项。如果你也需要比赛数, 你可以试试这个:

find /path -name '*.pdf' -exec pdftotext {} - \; | grep -H -c "your query"

-H选项打印文件名,-c选项打印计数。你可以在以后删除计数。

答案 1 :(得分:2)

这会列出文本转换与您的查询匹配的所有文件:

find /path -name '*.pdf' -exec sh -c "pdftotext {} - | grep --label {} -l 'your query'" \;
相关问题