Python& MS Word:将.doc转换为.docx?

时间:2017-03-01 15:00:01

标签: python linux ubuntu ms-word automation

我发现了几个与我相似的问题,但没有一个答案接近我的需要。

规格:我正在使用Python 3并且没有MS Word。我的编程机器运行OS X,云机器也是linux / ubuntu。

我正在使用python-docx从每晚发送给我的.doc文件中提取值。但是,python-docx仅适用于.docx个文件,因此我需要先将文件转换为该扩展名。

所以,我有一个.doc文件需要转换为.docx。此脚本可能必须在云中运行,因此我无法安装任何类型的Office或类似Office的软件。可以这样做吗?

4 个答案:

答案 0 :(得分:0)

您可以使用unoconv-通用Office转换器。在LibreOffice / OpenOffice支持的任何文档格式之间进行转换。

unoconv -d document --format=docx *.doc
subprocess.call(['unoconv', '-d', 'document', '--format=docx', filename])

答案 1 :(得分:0)

您正在使用Linux / ubuntu,可以使用LibreOffice的内置转换器。

语法

lowriter --convert-to docx *.doc

示例

lowriter --convert-to docx testdoc.doc

这会将所有doc文件转换为docx,并保存在同一文件夹中。

答案 2 :(得分:0)

Aspose.Words Cloud SDK for Python可以将DOC转换为DOCX。该软件包可以在任何平台上使用Python打开,生成,编辑,拆分,合并,比较和转换Word文档,而无需依赖MS Word。

这是一种付费产品,但免费计划每月提供150次免费API调用。

P.S:我是Aspose的开发人员。

>>> min(len_sorted)
'Passenger 1'

>>> max(len_sorted)
'Passenger 6'

答案 3 :(得分:-1)

首先,您需要使用Windows。如果这是一个可接受的障碍,那么请继续阅读......

接下来,您需要安装Microsoft Office Compatibility Pack

现在下载并安装Microsoft Office Migration Planning Manager

要运行该工具,您需要创建一个控制程序的.ini文件。此blog post提供了一个示例.ini文件和更多信息。 Microsoft here提供了更详细的信息。