电子邮件客户端使用哪种charcter编码来编码日文字符?

时间:2016-01-22 06:57:29

标签: character-encoding mime email-client webmail

我正在分析MIME中使用的字符集以组合多个字符集。

对于那个写为示例电子邮件:

This is sample test email 精巣日本 dsdsadsadsads

会自动转换为:

This is sample test email 精巣日本 dsdsadsadsads

我想知道,哪个字符集编码用于编码这些字符? 这是否可以在C?

中使用该字符集编码

电子邮件客户端:Postfix webmail

1 个答案:

答案 0 :(得分:1)

MIME的目的是允许支持任意内容类型和编码。只要内容在MIME标头中得到充分标记,您就可以使用您认为合适的任何编码。您的用例没有单一的正确编码;虽然在这个时代,迄今为止最简单的解决方案是将Unicode用于所有事情。

在MIME术语中,您使用Content-Type: text/plain; charset="utf-8"之类的内容,然后相应地对正文进行编码。如果您需要7位安全的电子邮件,您可以在顶部使用quoted-printable或base64 content-trasfer编码,但任何现代MIME库都应该为您处理这个细节。

您在实验中观察到的HTML实体不适用于纯文本电子邮件,但它们是纯HTML电子邮件的可行替代方案。 (如果您的网络邮件客户端在纯文本电子邮件中使用它们,则它有问题;只有在发件人和收件人都有相同的错误时才能使用它。)

传统上,日语电子邮件将使用遗留的日语编码之一,如Shift_JIS或ISO-2022-JP。这些对英语有合理的支持,但对于正确的多语言文本概括不足(尽管ISO-2022确实支持它)。相比之下,使用Unicode,将日语与例如日语混合波斯语,乌兹别克语和土耳其语是直截了当的,不受欢迎。

使用C语言的UTF-8很简单,基本上是透明的。参见例如http://utf8everywhere.org/了解一些起点。