Unix将多个文件夹中的多个文件类型合并为一个pdf

时间:2013-01-22 13:48:18

标签: unix pdf merge jpeg .doc

我有一个包含大约30个子文件夹的父文件夹,每个子文件夹包含pdfs,.doc,.docx和.jpg文件。我需要将所有文件合并为一个大的pdf。我想将文件附加到'master pdf'中的顺序反映我当前的文件夹和文件顺序(子文件夹名称的字母和每个子文件夹中文件的数字)。

我对Unix很新,我对此有点困惑....如果您对如何解决这个问题有任何建议,我将非常感激。谢谢。

1 个答案:

答案 0 :(得分:1)

这里有三个问题:

  1. 遍历目录树以查找所有文档
  2. 将每个文件转换为PDF
  3. 合并PDF
  4. 对于第一部分,您可以使用find命令获取文件列表或脚本遍历目录。

    对于第二部分,您可以使用OpenOffice / LibreOffice命令行驱动程序转换.doc.docx文件,并ghostscript转换.jpg个文件。

    对于第三部分,可能再次ghostscript

    或者,有一些很好的PDF API可用于某些编程语言,例如来自Lowagie for Java的iText。