“EF BF BF”是XML中允许的字符(UTF-8)吗?
<?xml version="1.0" encoding="UTF-8" ?>
<XML>
<DOCUMENT>
<CONTENT>" "</CONTENT>
</DOCUMENT>
</XML>
答案 0 :(得分:4)
如果“EF BF BF”是拼写错误,您的意思是“EF BB BF”:
是的,如果是第一个字节。它们是“BOM”Byte Order Mark,用于标识文件的endianness。
对于UTF-16和UTF-32编码的文件,这是强制性的。
对于UTF-8,这是可选的。如果存在某些系统可能会被它混淆,如果在期望例如ISO-8859-1的上下文中使用带有BOM的UTF-8文件,则可能会出现意外行为。
修改强>: 如果“EF BF BF”不是拼写错误,则文件中的任何位置都为not valid UTF-8。