用Python读/写MS Word文件

时间:2008-10-09 18:06:52

标签: python ms-word read-write

是否可以在不使用COM对象的情况下以Python读写Word(2003和2007)文件? 我知道我可以:

f = open('c:\file.doc', "w")
f.write(text)
f.close()

但Word会将其读取为HTML文件而非本机.doc文件。

4 个答案:

答案 0 :(得分:39)

请参阅python-docx,其官方文档可用here

这对我来说非常有效。

答案 1 :(得分:11)

如果你只阅读什么,那么使用linux soffice命令将它转换为文本,然后将文本加载到python中是simplest

答案 2 :(得分:7)

我会研究IronPython,它本质上可以访问Windows / office API,因为它在.NET运行时运行。

答案 3 :(得分:3)

doc(本例中为Word 2003)和docx(Word 2007)是不同的格式,后者通常只是xml和图像文件的存档。我想可以通过操作这些xml文件的内容来写入docx文件。但是,我没有看到如何在没有某种类型的COM组件接口的情况下读取和写入doc文件。