我发现了几个与我相似的问题,但没有一个答案接近我的需要。
规格:我正在使用Python 3并且没有MS Word。我的编程机器运行OS X,云机器也是linux / ubuntu。
我正在使用python-docx
从每晚发送给我的.doc
文件中提取值。但是,python-docx
仅适用于.docx
个文件,因此我需要先将文件转换为该扩展名。
所以,我有一个.doc
文件需要转换为.docx
。此脚本可能必须在云中运行,因此我无法安装任何类型的Office或类似Office的软件。可以这样做吗?
答案 0 :(得分:0)
您可以使用unoconv-通用Office转换器。在LibreOffice / OpenOffice支持的任何文档格式之间进行转换。
unoconv -d document --format=docx *.doc
subprocess.call(['unoconv', '-d', 'document', '--format=docx', filename])
答案 1 :(得分:0)
您正在使用Linux / ubuntu,可以使用LibreOffice的内置转换器。
lowriter --convert-to docx *.doc
lowriter --convert-to docx testdoc.doc
这会将所有doc文件转换为docx,并保存在同一文件夹中。
答案 2 :(得分:0)
Aspose.Words Cloud SDK for Python可以将DOC转换为DOCX。该软件包可以在任何平台上使用Python打开,生成,编辑,拆分,合并,比较和转换Word文档,而无需依赖MS Word。
这是一种付费产品,但免费计划每月提供150次免费API调用。
P.S:我是Aspose的开发人员。
>>> min(len_sorted)
'Passenger 1'
>>> max(len_sorted)
'Passenger 6'
答案 3 :(得分:-1)
首先,您需要使用Windows。如果这是一个可接受的障碍,那么请继续阅读......
接下来,您需要安装Microsoft Office Compatibility Pack。
现在下载并安装Microsoft Office Migration Planning Manager。
要运行该工具,您需要创建一个控制程序的.ini文件。此blog post提供了一个示例.ini文件和更多信息。 Microsoft here提供了更详细的信息。