PHP iconv_strlen问题

时间:2011-06-13 11:20:35

标签: php utf-8 iconv

当icon_strlen因错误的字符序列失败而具体character sequences是我想知道的时候是什么意思。感谢

1 个答案:

答案 0 :(得分:4)

character sequence是一系列字节。使用UTF-8时,并非所有字节组合都有效。

字节序列\xc2\xbc形成Unicode字符U+00BC,当使用UTF-8编码时,它是VULGAR FRACTION ONE QUARTER符号(¼)。

字节序列\xe2\x88\x9c形成Unicode字符U+221C,当使用UTF-8编码时,它是FOURTH ROOT符号(∜)。

UTF-8编码的错误字符序列是任何不适合UTF-8字节流所需模式的字节组合,例如字节序列\xbc\xbc是非法的,因为两个字节字符在第一个字节中必须110xxxxx,但\xbc10111100写为位。