Django输出word文件(.doc),只显示内容中的原始html

时间:2012-05-04 07:10:08

标签: python django html-escape-characters

我正在使用Django 1.4编写一个Web应用程序。我希望我的一个视图使用以下代码输出mirosoft word文档:

response = HttpResponse(view_data, content_type='application/vnd.ms-word')
response['Content-Disposition'] = 'attachment; filename=file.doc'
return response

然后,我可以成功下载file.doc,但是当我打开.doc文件时,我只找到像这样的原始html

<h1>some contents</h1>

不是标题1标题。

我是python&amp;的新手Django,我知道这可能是html转义的一些问题,有人可以帮我这个吗? 谢谢!:)

1 个答案:

答案 0 :(得分:2)

除非你有一些方法可以将你的回复(这里是我假设的HTML)转换为.doc文件,否则你将获得一个包含响应扩展名为.doc的文本文件。如果您愿意使用.docx文件,那么您应该查看一个名为python-docx的精彩python库,它允许您使用lxml库生成格式良好的docx文件。

或者,使用以下模板:

<html>
<head>
<META HTTP-EQUIV=""Content-Type"" CONTENT=""text/html; charset=UTF-8"">
<meta name=ProgId content=Word.Document>
<meta name=Generator content=""Microsoft Word 9"">
<meta name=Originator content=""Microsoft Word 9"">
<style>
@page Section1 {size:595.45pt 841.7pt; margin:1.0in 1.25in 1.0in 1.25in;mso-header-margin:.5in;mso-footer-margin:.5in;mso-paper-source:0;}
div.Section1 {page:Section1;}
@page Section2 {size:841.7pt 595.45pt;mso-page-orientation:landscape;margin:1.25in 1.0in 1.25in 1.0in;mso-header-margin:.5in;mso-footer-margin:.5in;mso-paper-source:0;}
div.Section2 {page:Section2;}
</style>
</head>
<body>
<div class=Section2>
'Section1: Portrait, Section2: Landscape

[your text here]

</div>
</body>
</html>

这应该是according to this asp.net forum post使用application/msword字符集作为mime类型UTF-8返回时生成有效的.doc文件(因此请确保字符串都是unicode)。