Python-Docx将HTML插入Docx

时间:2017-01-21 21:25:35

标签: python html python-docx italics

是否可以使用带有样式的python-docx将HTML插入到文档中? 我唯一需要做的就是斜体。

例如如何插入"Today is <i>Saturday</i>.",周六实际插入斜体?

谢谢!

2 个答案:

答案 0 :(得分:3)

p = document.add_paragraph()
p.add_run('Today is ') 
p.add_run('Saturday').italic = True 
p.add_run('.') 

图书馆不懂html。您必须自己解析文本,将斜体文本与非斜体文本分开,然后将其添加到文档中,如上所示。

答案 1 :(得分:1)

或者,从您的 html 文档中:

from htmldocx import HtmlToDocx

new_parser = HtmlToDocx()
new_parser.parse_html_file("html_filename", "docx_filename")
#Files extensions not needed, but tolerated