批量转换超过1500个文件到docx到png或pdf

时间:2017-05-18 19:24:16

标签: python pdf parallel-processing docx file-conversion

我使用的是Mac OS 10.12

我需要将1500-2000个文件从docx批量转换为png / pdf。

我尝试过pandoc,但丢失了文件格式和字体,这对任务来说是必不可少的。我可以将其并行化,但没有我需要的结果。

我已尝试过soffice,但每次运行需要大约6-8秒,每次运行都会生成一个新的libreoffice软件进程。后一部分阻止了soffice的并行化。

有什么方法可以处理这么多文件,同时保持字体和格式为pdf或png?

任何建议都将不胜感激。

0 个答案:

没有答案