我有pdf文件,我没有设法通过任何终端程序搜索的内容。 我只能通过Acrobat Reader和Skim搜索它们。
如何在终端中搜索pdf -files的内容?
似乎更好的问题是
如何在PDF浏览器中完成搜索,例如Acrobat Reader和Skim?
也许,如果不存在这样的工具,我需要制作这样的搜索工具。
答案 0 :(得分:2)
答案 1 :(得分:2)
pdftotext
确实是一个很好的工具,但它会产生很长的线条;为了grep,你会想要打破它们,例如,
pdftotext drscheme.pdf - | fmt | grep -i spidey
答案 2 :(得分:1)
PDF文件通常是压缩的。 Acrobat Reader和Skim等PDF查看器通过将PDF文本解压缩到内存中,然后搜索该文本来搜索内容。如果要从命令行搜索,可能的建议是使用pdftk解压缩PDF,然后使用grep
(或您最喜欢的命令行文本搜索实用程序)来查找所需的文本。例如:
# Search for the text "text_to_search_for", and print out 3 lines of context
# above and below each match
pdftk mydoc.pdf output - uncompress | grep -C3 text_to_search_for