如何在linux中使用pdftext在多个pdf文件中搜索单词

时间:2013-06-18 11:40:40

标签: linux grep pdftotext

我在文件夹中有一些pdf文件,通过使用以下命令,我可以获取包含匹配单词的文件名和行。

pdftotext "sample.pdf" - | grep "search-word" 

但这只适用于单个pdf文件,我想在其内容中包含搜索字的文件夹中获取所有文件名。我不想显示匹配的行,请建议我。 感谢

1 个答案:

答案 0 :(得分:1)

以下内容应列出与模式匹配的文件:

for i in `find . -type f -name "*.pdf"`; do
  pdftotext "${i}" - | grep -lq "search-word" && echo $i;
done

grep的-q选项可防止任何输出到STDOUT。 -l列出匹配的文件。