我正在尝试将几个pdf文件合并到一个页面中。我使用ghostcript合并所有这些但是当我合并一个空白页面时我有问题。所以我必须检查每一个空白的pdf文档。有没有办法用标准的bash shell或Ruby语言做到这一点?
我正在使用pdffonts来识别pdf是否为空白。我正在使用命令:
pdffonts 00001.pdf
如果pdf为空,则结果为:
name type emb sub uni object ID
------------------------------------ ----------------- --- --- --- ---------
如果pdf不为空,则结果为
name type emb sub uni object ID
------------------------------------ ----------------- --- --- --- ---------
Helvetica Type 1 no no no 6 0
答案 0 :(得分:1)
我对bash编程知之甚少,但是编写一个程序会在你的目录中的每个文件上调用pdffonts似乎是可行的,计算返回的行数,如果该数量大于2,则将其添加到合并else会移动到名为blank_pdfs的目录中。
以下是如何计算程序在bash中返回的行数。
Capture number of lines of output and return code simultaneously
答案 1 :(得分:0)
gs -sDEVICE=bbox
将为您提供文件/页面的最小边界框。空页应该非常小。