当icon_strlen因错误的字符序列失败而具体character sequences
是我想知道的时候是什么意思。感谢
答案 0 :(得分:4)
character sequence
是一系列字节。使用UTF-8时,并非所有字节组合都有效。
字节序列\xc2\xbc
形成Unicode字符U+00BC
,当使用UTF-8编码时,它是VULGAR FRACTION ONE QUARTER
符号(¼)。
字节序列\xe2\x88\x9c
形成Unicode字符U+221C
,当使用UTF-8编码时,它是FOURTH ROOT
符号(∜)。
UTF-8编码的错误字符序列是任何不适合UTF-8字节流所需模式的字节组合,例如字节序列\xbc\xbc
是非法的,因为两个字节字符在第一个字节中必须110xxxxx
,但\xbc
是10111100
写为位。