正如标题所说,我想知道是否有任何模块允许我通过python将一个Microsoft Word文档中的内容解析为另一个并保留格式。
我想读取表数据并将其传输到另一个文档中的另一个表。
文档A和B都存在。我只是希望能够遍历两个文档中的单元格(不一定同时)并复制内容,而不必担心文本是否格式化(字体,斜体,粗体)或包含项目符号。
我要求python,因为它是我最喜欢的语言......
答案 0 :(得分:4)
遵循Kasra建议使用python-docx:
粗略的示例代码。
查询表格文件:
from docx import *
document = opendocx('xxxzzz.docx')
table = document.xpath('/w:document/w:body/w:tbl', namespaces=nsprefixes)[0]
写入另一个文件:
output = opendocx('yyywwww.docx')
body = output.xpath('/w:document/w:body', namespaces=nsprefixes)[0]
body.append(table)
output.save('new-file-name.docx')