HTML电子邮件中的奇怪字符

时间:2010-06-03 06:51:00

标签: html email encoding character

我正在阅读来自maildir的电子邮件,有些电子邮件中包含奇怪的字符集:

=3D
=09

我认为= 3D = =和= 09是一个空格。还有其他一些,但我不确定:

=E2
=80
=93

有谁知道这些是什么以及我在这里处理的编码问题?

顺便说一句,我试过通过POP3获取这些电子邮件,这是同样的事情。我在SO上发布这个的原因不是因为我使用常规邮件客户端来读取数据。我正在通过PHP阅读maildir文件。也许常规的电子邮件客户端会检测到这是什么编码并处理它。

谢谢!

1 个答案:

答案 0 :(得分:6)

看起来像quoted-printable编码。

这是一种编码形式,用于在介质上发送8位字符编码,这可能无法保留高位 - 即,它们不是8位干净的。在过去,一些邮件服务器没有保留一个字节的所有8位。

  • 如果您在消息来源中看到这些内容但未在电子邮件客户端中看到,则这是正常现象。

  • 如果您在电子邮件客户端中看到这些内容,那么发件人正在使用的任何软件都会出现问题 - 很可能,Content-Transfer-Encoding标头未正确指定(告诉电子邮件客户端)如何解码它。)

如果您正在编写电子邮件客户端并希望能够处理此问题,则需要阅读Content-Transfer-Encoding标头。当然,如果你这样做,你也会遇到多部分消息/附件,base64等等。