编码(UTF-x)和XML

时间:2013-12-06 20:04:26

标签: xml encoding utf-8

我正在使用电子邮件系统,我们正面临编码问题。我们通过MQ向电子邮件系统发送XML字符串。 XML的<name>标记包含双字节字符(日语汉字)。 XML字符串中的编码指定UTF8。当电子邮件应用程序收到字符串时,他们只是将每个标记解析并将其解析为电子邮件正文。

我相信缺少一步。 XML字符串的接收者/作者是否需要在生成将执行正确编码的电子邮件正文之前添加一个步骤,以便可以正确显示/打印汉字字符。

1 个答案:

答案 0 :(得分:3)

XML的编码状态为UTF-8,因此内容必须正确编码为UTF-8,否则XML格式不正确。电子邮件可以使用许多不同的字符集,因此必须将XML解码为Unicode,然后重新编码为电子邮件实际使用的任何字符集。您最好的选择是确保XML编码为UTF-8,在收到XML后验证,然后使用UTF-8发送电子邮件。然后,您不必担心解码XML并重新编码其内容。