Java邮件发件人地址被删除非ASCII字符

时间:2015-08-06 15:30:59

标签: java email unicode javamail

MimeMessage mm;
mm.setFrom(new InternetAddress("\"Test\u0161\u0160\" <test@example.net>"));

部署到WebLogic的Web应用程序中的上述代码会破坏非ascii字符(它们是'š'和'Š'),但仅限于某些服务器环境。将邮件发送到SMTP服务器的网络捕获显示: (邮件标题部分)

   0x0060:  0a46 726f 6d3a 2022 5465 7374 2061 2060  .From:."Test.a.`
   0x0070:  203c 7465 7374 4065 7861 6d70 6c65 2e6e  .<test@example.n
   0x0080:  6574 3e0d 0a                             et>..

所以代码\ u016​​1被“转换”为20 61而\ u016​​0被“转换”为20 60。

从哪里开始寻找?我怀疑一些环境设置,虽然它无关紧要,因为Java内部使用Unicode并且所有数据都是正确的,直到离开JVM。另外,与SMTP服务器通信时,应使用一些已建立的约定来编码文本。

从属性文件中读取实际字符串,其中定义为:

  

mailFrom =“Test \ u016​​1 \ u016​​0”&lt; test@example.net>

通过调试日志输出证明它已正确读取。

我添加了一些调试输出(在调用 mm.setFrom(fromAddress)后运行):

logger.info("set:{}, get:{}",  fromAddress, mm.getFrom()[0].toString());

在“好”系统(Sun Java 1.6.0_45,tomcat 6.0.44)上打印:

  

设置:“TestšŠ”&lt; test@example.net>,get:=?UTF-8?Q?Test = C5 = A1 = C5 = A0?=&lt; test@example.net>

在“坏”系统(WebLogic 10.3.5,JRockit 1.6.0_26)上打印:

  

设置:“TestšŠ”&lt; test@example.net> ;,获取:“TestšŠ”&lt; test@example.net>

所以它似乎忘记了正确编码Unicode字符。 JRE中的错误?

更多信息

事实证明,WL使用javax.mail_1.1.0.0_1-4-1.jar而tomcat使用geronimo-javamail_1.4_spec-1.7.1.jar

1 个答案:

答案 0 :(得分:1)

采用单个String的InternetAddress构造函数要求该字符串采用正确的MIME格式,这意味着所有ASCII都具有任何非ASCII字符编码。

如果您使用带有单独电子邮件地址和人名字符串的InternetAddress构造函数,它将为您编写个人名称中的非ASCII字符。

不幸的是,我发现您以非MIME格式将地址存储在属性文件中。如果您无法更改属性文件中数据的格式,最好的办法是解析数据以提取不同的字段,然后使用双字符串InternetAddress构造函数:

    InternetAddress ia =
        new InternetAddress("\"Test\u0161\u0160\" <test@example.net>");
    InternetAddress ia2 =
        new InternetAddress(ia.getAddress(), ia.getPersonal());
    System.out.println(ia2);

给出:

=?UTF-8?Q?Test=C5=A1=C5=A0?= <test@example.net>

这恰好起作用,因为MIME字符串InternetAddress构造函数的当前实现不会拒绝非法的非ASCII字符。