在码点重要之后出现组合变音符号的顺序是什么?

时间:2011-05-31 09:02:40

标签: string unicode standards semantics diacritics

我想知道在码点之后组合变音符号的顺序是否会改变变音符号应该如何堆叠在字符的上方或下方;或者是否存在其他语义差异。

规范化是否指定了一些重新排序变音符号的方法,例如: G。加快字符串比较?

2 个答案:

答案 0 :(得分:6)

根据this Wikipedia article,组合字符的顺序在某些情况下是相关的,应该按照其他情况的规定进行标准化。

具体地说,必须保留组合字符与相同组合类的顺序(即它是相关的),而字符组必须按其组合类进行排序。

答案 1 :(得分:3)

是的,这很重要,而且必须是为了使一些案例明确无误:

  • 正常形式D:U,U + 0308,U + 0304 - >正常形式C U + 01D6拉丁文小写字母U与分音符和Macron ǖ

  • 正常形式D:U,U + 0304,U + 0308 - >普通形式C U + 1E7B拉丁文小写字母U与Macron和Diaeresis

一般来说,在一个组合课程中,你会更接近这封信并远离它。