我需要使用python将.doc和.docx文件转换为.pdf

时间:2018-03-06 12:21:19

标签: python pdf converter doc

我需要使用python将.doc和.docx文件转换为.pdf。 我已经看到一些已经可用的答案但是正在使用comtypes并打开WordApplication。我做不到。 我寻求的方法是使用一些python库来保存字体,表格,标题大小和图像等,无需打开MS Word或LibreOffice或类似的东西 如果需要,将.doc和.docx文件转换为某种中间格式(以及稍后将该格式转换为pdf)也可以。请帮我处理代码或指导说明(我不是python中的专业人员)我应该遵循。

1 个答案:

答案 0 :(得分:1)

我之前遇到过类似的问题,

我的建议:

抱歉,没有专门处理Microsoft办公室格式的直接python库(.doc)

因此尝试在Ubuntu中使用LibreOffice作为服务“libreoffice” 如果Windows的“soffice.exe”在命令行中使用它将文档转换为.PDF而不打开LibreOffice

它的简单快速也超过了几乎完美的文件转换。

样本:

对于Windows:

    C:\Program Files (x86)\LibreOffice 4\program\soffice.exe" --headless --convert-to pdf "input_file_path" --outdir "output_dir_path"

这会将输入文件转换为给定输出目录中的pdf,而无需打开LibreOffice,只需将其用作服务。

要从python运行此命令,您可以像库一样使用“子进程”。