我知道有一些用于编辑excel文件的库,但有什么用于在python中编辑msword 97/2000/2003 .doc文件吗?理想情况下,我想根据文本内容对文本的格式进行一些小的更改。一个非常简单的例子就是突出显示以大写字母开头的每个单词。
答案 0 :(得分:4)
为什么不考虑使用python-uno将文档加载到OpenOffice中并使用UNO接口对其进行操作。我刚刚链接到的网站上有一些示例代码,可以帮助您入门。
答案 1 :(得分:3)
如果平台独立性很重要,那么我建议通过BASIC或Python使用OpenOffice API。 OpenOffice也可以在无头模式下运行,无需GUI,因此您可以自动执行批处理作业。这些链接可能会有所帮助:
它肯定比导入模块和执行字符串替换更复杂,但OpenOffice可能是最好的免费.doc读取器,您可以加入。
答案 2 :(得分:1)
PyWin32库允许您从Python访问COM对象,包括所有各种Office COM API。我不会声称使用简单,但它确实有用。
答案 3 :(得分:1)
根据this SO post,我发现了使用jXLS的Apache POI。 POI有许多子组件,包括HWPF:
HWPF是我们的Microsoft Word端口 97文件格式为纯Java。它 支持读取和限制写入 能力。请参阅HWPF 项目页面了解更多信息。 该组件处于早期阶段 发展。它已经可以读了 并编写简单的文件。
由于这是一个Java库,因此可以使用Jython编写脚本。我不知道写作能力有多好,但如果有帮助,请发表评论。