如果bash或ruby中的文档为空,请检查PDF

时间:2012-10-11 03:58:41

标签: ruby bash pdf

我正在尝试将几个pdf文件合并到一个页面中。我使用ghostcript合并所有这些但是当我合并一个空白页面时我有问题。所以我必须检查每一个空白的pdf文档。有没有办法用标准的bash shell或Ruby语言做到这一点?

我正在使用pdffonts来识别pdf是否为空白。我正在使用命令:

  

pdffonts 00001.pdf

如果pdf为空,则结果为:

name                                type              emb sub uni object ID

------------------------------------ ----------------- --- --- --- ---------

如果pdf不为空,则结果为

name                                 type              emb sub uni object ID
------------------------------------ ----------------- --- --- --- ---------
Helvetica                            Type 1            no  no  no       6  0

2 个答案:

答案 0 :(得分:1)

我对bash编程知之甚少,但是编写一个程序会在你的目录中的每个文件上调用pdffonts似乎是可行的,计算返回的行数,如果该数量大于2,则将其添加到合并else会移动到名为blank_pdfs的目录中。

以下是如何计算程序在bash中返回的行数。

Capture number of lines of output and return code simultaneously

答案 1 :(得分:0)

gs -sDEVICE=bbox将为您提供文件/页面的最小边界框。空页应该非常小。