在pdf文件中查找特定文本并打印文件名和带有文本行

时间:2018-08-23 21:49:54

标签: pdf grep find

我已经在线搜索了,但找不到所需的答案。我需要在Linux环境中通过多个目录递归搜索名为“ monthly_spd.pdf”的文件,以查找诸如“ MOS-corrected”之类的关键字词组然后打印找到“ MOS-corrected”的行,并打印路径/文件名。

我已经在下面尝试过了,可以打印或显示文件/路径名,但是我还没有弄清楚如何打印在每个文件中找到关键词短语(“ MOS-corrected”)的行。谢谢。

 find . -name 'monthly_spd.pdf' -exec echo {} \: -exec pdftotext {} - \; | grep "MOS-corrected, r\|pdf"

1 个答案:

答案 0 :(得分:0)

我在下面的链接中找到了答案,方法是在我上面尝试在关键字词组周围打印上下文的解决方案中的“ grep”后面添加“ -C5”,这正是我所需要的。请参阅Colin D Bennett的评论/评论!

How to search contents of multiple pdf files?