Unicode代理和组合字符

时间:2017-11-01 12:41:55

标签: unicode utf-16 surrogate-pairs

我正在考虑在应用程序中使用UTF-16。但是我在理解一些关键概念时遇到了一些困难。 特别是代理人和组合人物。

据我所知,代理用于UTF-16,允许编码需要16位以上的代码点。 因此,如果我使用代理,我的UTF-16字符需要32位。

组合字符允许使用替代形式以实现旧的编码。例如,我可以将字符ä也写为a,后跟¨

  • ä:U + 00E4
  • a:U + 0061
  • ◌̈:U + 0308(结合分音符)

因此,如果我将代理与combinig字符一起使用,那么我的角色需要2 x 32位进行编码。当然,这不是我的例子。由于没有涉及代理人。但它可能与其他角色一起发生吗?

0 个答案:

没有答案