我正在提供一个电子邮件API,允许您通过XML / JSON获取某些电子邮件的内容。
我的问题是,我有一个列表视图,我想一次显示多封电子邮件的文本。并且文本使用不同的编码进行编码。
我尝试将特定的编码文本放在XML的CDATA部分,以便允许它。但现在我仍然得到错误:
This page contains the following errors:
error on line 45 at column 23: Input is not proper UTF-8, indicate encoding !
Bytes: 0x10 0x30 0x30 0x33
我在这些电子邮件中有各种各样的字符编码,从ISO到拉丁语等。是否有一种“通用”编码,我可以在XML编码中声明没有错误?
JSON序列化工作得非常好。
答案 0 :(得分:0)
如果您有办法知道传入数据的编码,只需将其解码为Unicode,然后在创建XML之前以UTF-8对其进行编码。
# e.g. latin1 -> utf-8
text.decode('latin1').encode('utf-8')