无法在终端中搜索pdf文件的内容

时间:2009-03-29 03:12:03

标签: search pdf

我有pdf文件,我没有设法通过任何终端程序搜索的内容。 我只能通过Acrobat Reader和Skim搜索它们。

如何在终端中搜索pdf -files的内容?

似乎更好的问题是

如何在PDF浏览器中完成搜索,例如Acrobat Reader和Skim?

也许,如果不存在这样的工具,我需要制作这样的搜索工具。

3 个答案:

答案 0 :(得分:2)

尝试从xpdf安装MacPorts;它应该带有一个名为pdftotext的工具,然后允许你使用grep进行搜索。

答案 1 :(得分:2)

pdftotext确实是一个很好的工具,但它会产生很长的线条;为了grep,你会想要打破它们,例如,

pdftotext drscheme.pdf - | fmt | grep -i spidey

答案 2 :(得分:1)

PDF文件通常是压缩的。 Acrobat Reader和Skim等PDF查看器通过将PDF文本解压缩到内存中,然后搜索该文本来搜索内容。如果要从命令行搜索,可能的建议是使用pdftk解压缩PDF,然后使用grep(或您最喜欢的命令行文本搜索实用程序)来查找所需的文本。例如:

# Search for the text "text_to_search_for", and print out 3 lines of context
# above and below each match
pdftk mydoc.pdf output - uncompress | grep -C3 text_to_search_for