我想将Pdf文件转换为doc或docx文件格式。我已经完成了此任务,但是图像非常模糊。
我已经尝试过在centos中使用libreoffice shell命令,但是输出不可读。
我想以Doc格式无损转换pdf。
我需要python代码进行转换。
或任何免费的Api将pdf转换为Docx。
或从任何网站或任何在线工具自动将其转换的脚本。
我尝试了一个API“ cloudconvert”,但对质量不满意。 我已经在bash命令中尝试使用soffice / libreoffice,但是该文件不可读。
for top, dirs, files in os.walk('/root/con_pdf'):
for filename in files:
if filename.endswith('.pdf'):
abspath = os.path.join(top, filename)
subprocess.call('soffice --invisible --convert-to docx "{}"'
.format(abspath), shell=True)
~