使用python-docx将HTML转换为Word文档?

时间:2015-10-05 17:17:16

标签: python html python-2.7 python-docx

我想从HTML字段生成Word文档(您可以将其写入文本并将其设置为粗体,斜体,字体颜色大小......)。我用这个Python-docx来生成WOrd文档.Everythink是Ok(添加图片,文本,..)唯一的问题是样式。问题是我在word文档中有内容但没有样式。

我尝试将内容保存为HTML文件,然后创建如下所示的python-docx文件:

html_f=open('f_html.html','w') 
html_f.write(u''+contenu) 
html_f.close() 


doc2=docx.Document('f_html.docx')

但我没有结果,而Document()却找不到该文件。 请帮忙

2 个答案:

答案 0 :(得分:2)

Python-docx只接受纯文本。您可以使用pywin32扩展名来转换您的html文件。我发现一个简单的例子:

[1.0f,1.0f,1.0f]

答案 1 :(得分:0)

或者:

from htmldocx import HtmlToDocx

new_parser = HtmlToDocx()
new_parser.parse_html_file("html_filename", "docx_filename")
#Files extensions not needed, but tolerated