我正在考虑在应用程序中使用UTF-16。但是我在理解一些关键概念时遇到了一些困难。 特别是代理人和组合人物。
据我所知,代理用于UTF-16,允许编码需要16位以上的代码点。 因此,如果我使用代理,我的UTF-16字符需要32位。
组合字符允许使用替代形式以实现旧的编码。例如,我可以将字符ä
也写为a
,后跟¨
。
ä
:U + 00E4 a
:U + 0061 ◌̈
:U + 0308(结合分音符)因此,如果我将代理与combinig字符一起使用,那么我的角色需要2 x 32位进行编码。当然,这不是我的例子。由于没有涉及代理人。但它可能与其他角色一起发生吗?