用于linux的CLI pdf viewer

时间:2010-08-25 22:03:48

标签: linux pdf command-line ncurses pdftotext

嘿,现在已经有一段时间了,我正在为命令行寻找一个pdf查看器。

由于我喜欢在Linux上没有X工作,并且经常在远程机器上工作,我想有一个工具来阅读pdfs。有很多非常好的图形程序(evince,okular,acroread,...)来完成这项工作,所以我认为应该至少有一个像样的文本模式工具。但我甚至不知道一个糟糕的人!

目前,我要么只是开始读取pdf,要么使用pdftohtml + lynx。 然而,后者不会产生非常好的输出,大多数文档都是不可读的,特别是如果它们包含数学公式。

Google上有很多人说不可能或建议使用pdftohtml版本。

我知道,这不是一个编程问题,但我正在考虑启动一个项目来实现这样的程序,除非那里已经有一个好的程序。

感谢您的任何建议。

7 个答案:

答案 0 :(得分:70)

您好我认为您不需要为您的目的编写程序我的意思是在控制台模式下读取pdf文件,因为“less”命令已经为您完成了。所以使用它并享受它。

少“pdf文件的名称”

答案 1 :(得分:16)

好的,你甚至要求知道“蹩脚”的。这里有两个(自己决定他们各自的疯狂):

首先:Ghostscript's txtwrite输出设备

 gs \
   -dBATCH \
   -dNOPAUSE \
   -sDEVICE=txtwrite \
   -sOutputFile=- \
   /path/to/your/pdf

第二:XPDF's pdftotext CLI实用程序(优于Ghostscript):

 pdftotext \
   -f 13 \
   -l 17 \
   -layout \
   -opw supersecret \
   -upw secret \
   -eol unix \
   -nopgbrk \
   /path/to/your/pdf
   - |less

这将显示页面范围13( f 第一页)到17( l ast页面),保留双密码保护的命名PDF文件的布局(使用用户和所有者密码 secret supersecret ),使用Unix EOL约定,但没有在PDF页面之间插入分页符,通过较少的管道...

pdftotext -h显示所有可用的命令行选项。

当然,这两种工具仅适用于PDF的文本部分(如果有的话)。哦,数学公式也不会太好用......; - )


修改:我输错了上面的命令(最初使用pdftops代替pdftotext)。

答案 2 :(得分:5)

答案 3 :(得分:5)

顺便说一句,我总是在同样的情况下,我使用mc(午夜指挥官)处理文本pdf非常好... 只需在mc中查看文件(F3)

即可

答案 4 :(得分:4)

还有green PDF查看器。 YouTube上有一个演示。

答案 5 :(得分:3)

fbpdf是一个帧缓冲的pdf查看器。

还有一个分叉,jfbpdf,但目前我无法让它发挥作用。

答案 6 :(得分:0)

这仅适用于PDF文档的结构化,即它是tagged PDF文档。

这是获取文档中文本对象的正确读取顺序所必需的。

标记的PDF文档也允许您重新流动文档,但我不知道有任何工具使用命令行输出。