是否可以在不使用COM对象的情况下以Python读写Word(2003和2007)文件? 我知道我可以:
f = open('c:\file.doc', "w")
f.write(text)
f.close()
但Word会将其读取为HTML文件而非本机.doc文件。
答案 0 :(得分:39)
请参阅python-docx,其官方文档可用here。
这对我来说非常有效。
答案 1 :(得分:11)
如果你只阅读什么,那么使用linux soffice命令将它转换为文本,然后将文本加载到python中是simplest:
答案 2 :(得分:7)
我会研究IronPython,它本质上可以访问Windows / office API,因为它在.NET运行时运行。
答案 3 :(得分:3)
doc(本例中为Word 2003)和docx(Word 2007)是不同的格式,后者通常只是xml和图像文件的存档。我想可以通过操作这些xml文件的内容来写入docx文件。但是,我没有看到如何在没有某种类型的COM组件接口的情况下读取和写入doc文件。