Python:创建一个"目录"使用python-docx / lxml

时间:2013-09-03 15:17:54

标签: python docx wordml python-docx

我正在尝试在python-docx(https://github.com/mikemaccana/python-docx)的帮助下自动创建.docx文件(WordML)。我当前的脚本使用以下循环手动创建ToC:

for chapter in myChapters:
    body.append(paragraph(chapter.text, style='ListNumber'))

有没有人知道使用“内置单词”ToC功能的方法,它会自动添加索引并创建各个章节的段落链接?

非常感谢!

4 个答案:

答案 0 :(得分:13)

关键的挑战是渲染的ToC依赖于分页来知道为每个标题放置的页码。分页是布局引擎提供的功能,布局引擎是Word客户端内置的一个非常复杂的软件。用Python编写页面布局引擎可能不是一个好主意,绝对不是我计划很快进行的项目:)

ToC由两部分组成:

  1. 指定ToC展示位置的元素以及要包含哪些标题级别的内容。
  2. 实际可见的ToC内容,标题和页码,用虚线连接它们。
  3. 创建元素非常简单,而且工作量相对较低。创建实际可见内容(至少如果您想要包含页码)需要Word布局引擎。

    以下是选项:

    1. 只需添加标签和其他一些位来发信号通知ToC需要更新。首次打开文档时,会出现一个对话框,说明需要刷新链接。用户单击是,Bob是您的叔叔。如果用户单击否,则会显示ToC标题,其下方没有内容,并且可以手动更新ToC。

    2. 添加标记,然后通过C#或Visual Basic对Word自动化库使用Word客户端打开并保存文件;所有字段(包括ToC字段)都会更新。

    3. 如果您有SharePoint实例或使用Word Automation Services可以执行此操作的任何内容,请执行相同的服务器端。

    4. 在文档中创建一个AutoOpen宏,在打开文档时自动运行字段更新。可能不会通过大量的病毒检查程序,也无法在公司环境中常见的锁定Windows版本上工作。

    5. 这是a very nice set of screencasts by Eric White that explain all the hairy details

答案 1 :(得分:4)

很抱歉在旧帖子中添加评论,但我认为这可能会有所帮助。 这不是我的解决方案,但已在那里找到:https://github.com/python-openxml/python-docx/issues/36 感谢https://github.com/mustashhttps://github.com/scanny

    from docx.oxml.ns import qn
    from docx.oxml import OxmlElement

    paragraph = self.document.add_paragraph()
    run = paragraph.add_run()
    fldChar = OxmlElement('w:fldChar')  # creates a new element
    fldChar.set(qn('w:fldCharType'), 'begin')  # sets attribute on element
    instrText = OxmlElement('w:instrText')
    instrText.set(qn('xml:space'), 'preserve')  # sets attribute on element
    instrText.text = 'TOC \\o "1-3" \\h \\z \\u'   # change 1-3 depending on heading levels you need

    fldChar2 = OxmlElement('w:fldChar')
    fldChar2.set(qn('w:fldCharType'), 'separate')
    fldChar3 = OxmlElement('w:t')
    fldChar3.text = "Right-click to update field."
    fldChar2.append(fldChar3)

    fldChar4 = OxmlElement('w:fldChar')
    fldChar4.set(qn('w:fldCharType'), 'end')

    r_element = run._r
    r_element.append(fldChar)
    r_element.append(instrText)
    r_element.append(fldChar2)
    r_element.append(fldChar4)
    p_element = paragraph._p

答案 2 :(得分:0)

@Mawg //更新ToC

发生相同的问题以更新ToC并用Google搜索。不是我的代码,但是它可以工作:

word = win32com.client.DispatchEx("Word.Application")
doc = word.Documents.Open(input_file_name)
doc.TablesOfContents(1).Update()
doc.Close(SaveChanges=True)
word.Quit()

答案 3 :(得分:0)

使用python在Word中创建自动目录:

#First set directory where you want to save the file

import os
os.chdir("D:/")

#Now import required packages

import docx
from docx import Document
from docx.oxml.ns import qn
from docx.oxml import OxmlElement

#Initialising document to make word file using python

document = Document()

#Code for making Table of Contents

paragraph = document.add_paragraph()
run = paragraph.add_run()
fldChar = OxmlElement('w:fldChar')  # creates a new element
fldChar.set(qn('w:fldCharType'), 'begin')  # sets attribute on element
instrText = OxmlElement('w:instrText')
instrText.set(qn('xml:space'), 'preserve')  # sets attribute on element
instrText.text = 'TOC \\o "1-3" \\h \\z \\u'   # change 1-3 depending on heading levels you need

fldChar2 = OxmlElement('w:fldChar')
fldChar2.set(qn('w:fldCharType'), 'separate')
fldChar3 = OxmlElement('w:t')
fldChar3.text = "Right-click to update field."
fldChar2.append(fldChar3)

fldChar4 = OxmlElement('w:fldChar')
fldChar4.set(qn('w:fldCharType'), 'end')

r_element = run._r
r_element.append(fldChar)
r_element.append(instrText)
r_element.append(fldChar2)
r_element.append(fldChar4)
p_element = paragraph._p

#Giving headings that need to be included in Table of contents

document.add_heading("Network Connectivity")
document.add_heading("Weather Stations")

#Saving the word file by giving name to the file

name = "mdh2"
document.save(name+".docx")

#Now check word file which got created

#Select "Right-click to update field text"
#Now right click and then select update field option
#and then click on update entire table

#Now,You will find Automatic Table of Contents 

#谢谢