在python中将pdf转换为docx

时间:2019-08-17 13:10:10

标签: python-3.x pdf docx

我想将Pdf文件转换为doc或docx文件格式。我已经完成了此任务,但是图像非常模糊。

我已经尝试过在centos中使用libreoffice shell命令,但是输出不可读。

我想以Doc格式无损转换pdf。

我需要python代码进行转换。

或任何免费的Api将pdf转换为Docx。

或从任何网站或任何在线工具自动将其转换的脚本。

我尝试了一个API“ cloudconvert”,但对质量不满意。 我已经在bash命令中尝试使用soffice / libreoffice,但是该文件不可读。

for top, dirs, files in os.walk('/root/con_pdf'):
    for filename in files:
        if filename.endswith('.pdf'):
            abspath = os.path.join(top, filename)
            subprocess.call('soffice --invisible --convert-to docx "{}"'
                            .format(abspath), shell=True)
~

0 个答案:

没有答案