任何人都可以推荐用于操作文档的python模块。我需要的模块可以替换文本中的任何变量(即$$ TITLE $$)而不会丢失格式。模块需要Microsoft Word 2003/2007,OpenDocuments。
答案 0 :(得分:0)
我自己没试过,但https://github.com/mikemaccana/python-docx似乎就是你要找的。暂时没有更新,但它是您正在寻找的旧Word版本。
答案 1 :(得分:0)
据我所知,没有一个python模块可以一般地操作Microsoft和OpenOffice文档格式。
也就是说,Microsoft Office和OpenOffice(都可以)使用XML来存储他们的文档。对于Office 2003,XML是可选的,但从2010年开始,它是默认值。
所以你可以遵循两种方法:
快速和脏 使用XML工具包和XPath,在文档中选择(XML)文本节点。在每个文本节点上运行替换例程。
整齐,但是慢 研究每种文档类型的XML格式。使用XML工具包和XPath,选择将包含(文档)文本的节点。在每个文本节点上运行替换例程。
我会从快速和肮脏开始,看看它能带给你多远。然后,如果您发现更改了您不想更改的节点,则可以添加临时措施以防止基于研究XML格式的情况。