使用python-docx突出显示文本

时间:2017-09-08 12:18:25

标签: python python-docx

我想在docx中突出显示文本并将其另存为另一个文件。 这是我的代码

from docx import Document

def highlight_text(filename):

    doc = Document(filename)
    for p in doc.paragraphs:
        if 'vehicle' in p.text:
            inline = p.runs
            # print(inline)
            # Loop added to work with runs (strings with same style)
            for i in range(len(inline)):
                # print((inline[i].text).encode('ascii'))
                if 'vehicle' in inline[i].text:
                    x=inline[i].text.split('vehicle')
                    inline[i].clear()
                    for j in range(len(x)-1):
                        inline[i].add_text(x[j])
                        y=inline[i].add_text('vehicle')
                        y.highlight_color='YELLOW'
            # print (p.text)

    doc.save('t2.docx')
    return 1
if __name__ == '__main__':

    highlight_text('t1.docx')

这个词没有突出显示我做错了什么。

1 个答案:

答案 0 :(得分:1)

突出显示是字体的属性,而不是直接运行。此外,Run.add_text()会返回_Text个对象,而不是运行。

from docx.enum.text import WD_COLOR_INDEX

for paragraph in document.paragraphs:
    if 'vehicle' in paragraph.text:
        for run in paragraph.runs:
            if 'vehicle' in run.text:
                x = run.text.split('vehicle')
                run.clear()
                for i in range(len(x)-1):
                    run.add_text(x[i])
                    run.add_text('vehicle')
                    run.font.highlight_color = WD_COLOR_INDEX.YELLOW

此外,突出显示应用于整个运行,因此您需要为" vehicle"," vehicle"之前的每个文本创建单独的运行。单词本身,以及" vehicle"之后的文本。

此外,还不保证给定的单词完全出现在一次运行中;经常在一个单词中分开。因此,您需要在处理一般情况的方法上更加复杂。

所以这里还有很多工作要做,但这应该让你看到至少一些黄色突出显示:)