关于字符解码和哑剧解码

时间:2011-12-21 12:29:01

标签: mime-types utf8-decode

我在java中开发了一个程序,它从电子邮件帐户中获取电子邮件信息的主题,发件人,日期和日期时间。我已经使用html解析器和httpclient完成了。我有两个问题。

  1. 当我解析电子邮件的主题字符串时,我有时会得到一些错误的字符。例如如果主题是“嗨先生müller”,我收到主题字符串为“嗨先生müller”。正如你所看到的那样,它并没有正确地赋予ü字符。知道哪种编码是这个吗?是UTF-8吗?如何解码才能获得原始字符串?

  2. 我还通过pop3从yahoo帐户收到了主题,发件人,收件人,日期时间等电子邮件信息。在那里我注意到发件人的电子邮件ID包含ü或ue(例如reva.müller@gmx.de),它编码就像('=?iso-8859-1?Q?= 22Reva_M = FCller = 22?= “)。关于这是哪种编码的任何想法?它是mime编码吗?如何在java中解码它以获得正确的发送者字符串?

  3. 我真的很感激任何帮助......

1 个答案:

答案 0 :(得分:0)

您需要阅读RFC:http://www.ietf.org/rfc/rfc2045.txt。它会告诉你如何解释那些=符号。

参见“6.7。引用可打印的内容传输编码”。

还要查找Content-Type标头,以便了解编码。