使用非ASCII字符在Python中编码邮件主题(SMTP)

时间:2011-08-02 13:53:58

标签: python utf-8 character-encoding smtp cjk

我正在使用Python模块MimeWriter构建消息,而smtplib用于发送邮件构造的消息:

file msg.txt:
-----------------------
Content-Type: multipart/mixed;
from: me<me@abc.com>
to: me@abc.com
subject: 主題

Content-Type: text/plain;charset=utf-8

主題

我使用下面的代码发送邮件:

import smtplib
s=smtplib.SMTP('smtp.abc.com')
toList = ['me@abc.com']
f=open('msg.txt') #above msg in msg.txt file
msg=f.read()
f.close()
s.sendmail('me@abc.com',toList,msg)

我正确收到邮件正文,但主题不正确,

subject: some junk characters

主題           <- body is correct.

请建议?有没有办法指定用于主题的解码, 为身体指定。如何正确解码主题?

2 个答案:

答案 0 :(得分:29)

来自http://docs.python.org/library/email.header.html

from email.message import Message
from email.header import Header
msg = Message()
msg['Subject'] = Header('主題', 'utf-8')
print msg.as_string()
  

主题:=?utf-8?b?5Li76aGM?=

更简单:

from email.header import Header
print Header('主題', 'utf-8').encode()
  

=?UTF-8 2 B 4 5Li76aGM?=

答案 1 :(得分:6)

主题作为SMTP标头传输,并且只需要ASCII。要支持主题中的编码,您需要使用您要使用的任何编码为主题添加前缀。在你的情况下,我建议在主题前加上?UTF-8?B?这意味着UTF-8Base64已编码。

换句话说,我相信您的主题标题应该或多或少看起来像这样:

Subject: =?UTF-8?B?JiMyMDAyNzsmIzM4OTg4Ow=?=

在PHP中你可以像这样:

// Convert subject to base64
$subject_base64 = base64_encode($subject);
fwrite($smtp, "Subject: =?UTF-8?B?{$subject_base64}?=\r\n");

在Python中:

import base64
subject_base64 = base64.encodestring(subject).strip()
subject_line = "Subject: =?UTF-8?B?%s?=" % subject_base64