我可以在UTF-8编码的XML中包含诸如“ã”和“ê”之类的字符,还是必须是UTF-16编码的?

时间:2010-02-05 18:47:21

标签: xml encoding utf-8 character-encoding utf-16

我可以在UTF-8编码的XML中包含诸如“ã”和“ê”之类的字符,还是必须是UTF-16编码的?

2 个答案:

答案 0 :(得分:7)

您可以使用UTF-8编码这些字符。

关键是保持prolog(<?xml version="1.0" encoding="utf-8" ?>)和实际文件编码一致。

UTF-8的重点是能够以更小的占用空间编码所有Unicode字符。根据所有智慧的来源,wikipedia,utf-8以1到4个字节对每个字符点进行编码,并向后兼容ASCII

答案 1 :(得分:6)

所有Unicode转换格式编码都可以编码Unicode中的任何字符。给出的字符可在Unicode标准中找到。