在XML中呈现多个编码

时间:2013-04-21 15:09:42

标签: python xml json encoding utf-8

我正在提供一个电子邮件API,允许您通过XML / JSON获取某些电子邮件的内容。

我的问题是,我有一个列表视图,我想一次显示多封电子邮件的文本。并且文本使用不同的编码进行编码。

我尝试将特定的编码文本放在XML的CDATA部分,以便允许它。但现在我仍然得到错误:

This page contains the following errors:

error on line 45 at column 23: Input is not proper UTF-8, indicate encoding !
Bytes: 0x10 0x30 0x30 0x33

我在这些电子邮件中有各种各样的字符编码,从ISO到拉丁语等。是否有一种“通用”编码,我可以在XML编码中声明没有错误?

JSON序列化工作得非常好。

1 个答案:

答案 0 :(得分:0)

如果您有办法知道传入数据的编码,只需将其解码为Unicode,然后在创建XML之前以UTF-8对其进行编码。

# e.g. latin1 -> utf-8
text.decode('latin1').encode('utf-8')