标签: python pdf parallel-processing docx file-conversion
我使用的是Mac OS 10.12
我需要将1500-2000个文件从docx批量转换为png / pdf。
我尝试过pandoc,但丢失了文件格式和字体,这对任务来说是必不可少的。我可以将其并行化,但没有我需要的结果。
我已尝试过soffice,但每次运行需要大约6-8秒,每次运行都会生成一个新的libreoffice软件进程。后一部分阻止了soffice的并行化。
有什么方法可以处理这么多文件,同时保持字体和格式为pdf或png?
任何建议都将不胜感激。