双字节字符,其中一个字节是'<'或'>'

时间:2010-11-17 12:10:46

标签: character-encoding

是否有任何双字节编码字符,其中一个字节具有相同的ASCII字符值'<'或'>' ? 我似乎找不到一个,但我必须确保没有这种情况,因为这样的双字节字符可能会导致html解析器出错。

1 个答案:

答案 0 :(得分:2)

任何编码中?几乎肯定是的。实际上,有数百个字符具有0x3c或0x3e(ASCII中的<>的值)作为其UTF-16编码的字节之一,例如“☼”, UTF-16le表示看起来像<&的ASCII。

但是,如果没有指定带外(例如通过HTTP标头)编码它使用的编码,并且可能使用其他信号(如BOM)(HTML5所需),则在某些随机字符集中传送HTML是不合适的。 )或XML编码说明符(在某些情况下,XHTML是XML标准规定的)。

如果你的编码被正确指定,那么应该没有问题,因为字符 <>在HTML中是特殊的,而不是字节< / em> 0x3c和0x3e。任何以不同方式思考的“解析器”都会被破坏。