使用Python将包括表格的整个word文档复制到另一个

时间:2018-06-14 11:21:00

标签: python python-3.x ms-word python-docx

我需要将模板的全部内容复制到新文档中。问题是表格无法复制。目前,我的代码负责复制粗体和斜体等样式。

def get_para_data(output_doc_name, paragraph):
    output_para = output_doc_name.add_paragraph()
    for run in paragraph.runs:
        output_run = output_para.add_run(run.text)
        # Run's bold data
        output_run.bold = run.bold
        # Run's italic data
        output_run.italic = run.italic
        # Run's underline data
        output_run.underline = run.underline
        # Run's color data
        output_run.font.color.rgb = run.font.color.rgb
        # Run's font data
        output_run.style.name = run.style.name
    # Paragraph's alignment data
    output_para.paragraph_format.alignment = 
paragraph.paragraph_format.alignment
input_doc=Document('templatemain.docx')
output_doc=Document()
for para in input_doc.paragraphs:
    get_para_data(output_doc, para)
output_doc.save('OutputDoc.docx')

我发现复制表的大多数帮助都是附加它们。但我正在将一个模板复制到一个空白文档中,这对我来说根本没有帮助。

1 个答案:

答案 0 :(得分:4)

您只是迭代文档的.tables属性。表格通过python-docx属性单独列出。

您需要按文档顺序一起遍历文档正文的所有子元素,否则最终会将所有段落和表格捆绑在一起。 from docx.oxml.text.paragraph import CT_P from docx.oxml.table import CT_Tbl from docx.table import Table from docx.text.paragraph import Paragraph # select only paragraphs or table nodes for child in input_doc.element.body.xpath('w:p | w:tbl'): if isinstance(child, CT_P): paragraph = Paragraph(child, input_doc) get_para_data(output_doc, paragraph) elif isinstance(child, CT_Tbl): table = Table(child, input_doc) # do something with the table 库不直接提供此功能,您需要{{3}}。

例如,简化版本为:

@foreach (var group in apiGroups.OrderBy(g => g.Key.ControllerName))

表只能包含在文档正文,表格单元格中(因此嵌套在其他表格中),页眉和页脚,脚注和跟踪的更改中,但不在段落内。