“EF BF BF”是XML中允许的字符(UTF-8)吗?

时间:2012-04-25 06:08:01

标签: xml utf-8 character

“EF BF BF”是XML中允许的字符(UTF-8)吗?

<?xml version="1.0" encoding="UTF-8" ?>
<XML>
    <DOCUMENT>
        <CONTENT>" "</CONTENT>
    </DOCUMENT>
</XML>

1 个答案:

答案 0 :(得分:4)

如果“EF BF BF”是拼写错误,您的意思是“EF BB BF”:

是的,如果是第一个字节。它们是“BOM”Byte Order Mark,用于标识文件的endianness

对于UTF-16和UTF-32编码的文件,这是强制性的。

对于UTF-8,这是可选的。如果存在某些系统可能会被它混淆,如果在期望例如ISO-8859-1的上下文中使用带有BOM的UTF-8文件,则可能会出现意外行为。

修改: 如果“EF BF BF”不是拼写错误,则文件中的任何位置都为not valid UTF-8