用于文档模板管理的python模块

时间:2013-08-01 08:06:06

标签: python module

任何人都可以推荐用于操作文档的python模块。我需要的模块可以替换文本中的任何变量(即$$ TITLE $$)而不会丢失格式。模块需要Microsoft Word 2003/2007,OpenDocuments。

2 个答案:

答案 0 :(得分:0)

我自己没试过,但https://github.com/mikemaccana/python-docx似乎就是你要找的。暂时没有更新,但它是您正在寻找的旧Word版本。

答案 1 :(得分:0)

据我所知,没有一个python模块可以一般地操作Microsoft和OpenOffice文档格式。

也就是说,Microsoft Office和OpenOffice(都可以)使用XML来存储他们的文档。对于Office 2003,XML是可选的,但从2010年开始,它是默认值。

所以你可以遵循两种方法:

  1. 快速和脏 使用XML工具包和XPath,在文档中选择(XML)文本节点。在每个文本节点上运行替换例程。

  2. 整齐,但是慢 研究每种文档类型的XML格式。使用XML工具包和XPath,选择将包含(文档)文本的节点。在每个文本节点上运行替换例程。

  3. 我会从快速和肮脏开始,看看它能带给你多远。然后,如果您发现更改了您不想更改的节点,则可以添加临时措施以防止基于研究XML格式的情况。