是否有用于编辑msword doc文件的python库?

时间:2008-12-17 21:52:57

标签: python ms-word

  

可能重复:
  Reading/Writing MS Word files in Python

我知道有一些用于编辑excel文件的库,但有什么用于在python中编辑msword 97/2000/2003 .doc文件吗?理想情况下,我想根据文本内容对文本的格式进行一些小的更改。一个非常简单的例子就是突出显示以大写字母开头的每个单词。

4 个答案:

答案 0 :(得分:4)

为什么不考虑使用python-uno将文档加载到OpenOffice中并使用UNO接口对其进行操作。我刚刚链接到的网站上有一些示例代码,可以帮助您入门。

答案 1 :(得分:3)

如果平台独立性很重要,那么我建议通过BASIC或Python使用OpenOffice API。 OpenOffice也可以在无头模式下运行,无需GUI,因此您可以自动执行批处理作业。这些链接可能会有所帮助:

它肯定比导入模块和执行字符串替换更复杂,但OpenOffice可能是最好的免费.doc读取器,您可以加入。

答案 2 :(得分:1)

PyWin32库允许您从Python访问COM对象,包括所有各种Office COM API。我不会声称使用简单,但它确实有用。

答案 3 :(得分:1)

根据this SO post,我发现了使用jXLSApache POI。 POI有许多子组件,包括HWPF:

  

HWPF是我们的Microsoft Word端口   97文件格式为纯Java。它   支持读取和限制写入   能力。请参阅HWPF   项目页面了解更多信息。   该组件处于早期阶段   发展。它已经可以读了   并编写简单的文件。

由于这是一个Java库,因此可以使用Jython编写脚本。我不知道写作能力有多好,但如果有帮助,请发表评论。