如何在Linux上使用python更新docx文件中的目录?

时间:2018-07-16 11:22:47

标签: python openxml docx python-docx

我在docx文件中的更新目录中遇到了问题,该目录由Linux上的 python-docx 生成。通常,创建目录并不困难(感谢这个答案https://stackoverflow.com/a/48622274/9472173和这个线程https://github.com/python-openxml/python-docx/issues/36

from docx.oxml.ns import qn
from docx.oxml import OxmlElement

paragraph = self.document.add_paragraph()
run = paragraph.add_run()
fldChar = OxmlElement('w:fldChar')  # creates a new element
fldChar.set(qn('w:fldCharType'), 'begin')  # sets attribute on element
instrText = OxmlElement('w:instrText')
instrText.set(qn('xml:space'), 'preserve')  # sets attribute on element
instrText.text = 'TOC \o "1-3" \h \z \u'   # change 1-3 depending on heading levels you need

fldChar2 = OxmlElement('w:fldChar')
fldChar2.set(qn('w:fldCharType'), 'separate')
fldChar3 = OxmlElement('w:t')
fldChar3.text = "Right-click to update field."
fldChar2.append(fldChar3)

fldChar4 = OxmlElement('w:fldChar')
fldChar4.set(qn('w:fldCharType'), 'end')

r_element = run._r
r_element.append(fldChar)
r_element.append(instrText)
r_element.append(fldChar2)
r_element.append(fldChar4)
p_element = paragraph._p

但是稍后要使TOC可见,则需要更新字段。提及的波纹管解决方案涉及手动进行更新(右键单击TOC提示并选择“更新字段”)。对于自动更新,我发现了以下使用词应用程序模拟的解决方案(感谢此答案https://stackoverflow.com/a/34818909/9472173

import win32com.client
import inspect, os

def update_toc(docx_file):
    word = win32com.client.DispatchEx("Word.Application")
    doc = word.Documents.Open(docx_file)
    doc.TablesOfContents(1).Update()
    doc.Close(SaveChanges=True)
    word.Quit()

def main():
    script_dir = os.path.dirname(os.path.abspath(inspect.getfile(inspect.currentframe())))
    file_name = 'doc_with_toc.docx'
    file_path = os.path.join(script_dir, file_name)
    update_toc(file_path)

if __name__ == "__main__":
    main()

它在Windows上很有效,但显然在Linux上不行。让某人对如何在Linux上提供相同功能有任何想法。我唯一的建议是在每个标题中都使用本地URL(锚),但是我不确定 python-docx 是否可能,而且我对这些的理解也不强openxml 功能。我将非常感谢您的帮助。

1 个答案:

答案 0 :(得分:0)

我从此[Github Issue] [1]找到了解决方案。它可以在ubuntu上运行。

def set_updatefields_true(docx_path):
    namespace = "{http://schemas.openxmlformats.org/wordprocessingml/2006/main}"
    doc = Document(docx_path)
    # add child to doc.settings element
    element_updatefields = lxml.etree.SubElement(
        doc.settings.element, f"{namespace}updateFields"
    )
    element_updatefields.set(f"{namespace}val", "true")
    doc.save(docx_path)## Heading ##