Unicode一般类别中GC = Mark和GC =标点符号之间的区别是什么?

时间:2012-05-13 10:29:37

标签: unicode symbols punctuation character-properties

我无法理解一些概念。在Unicode规范中,有一个名为general category的属性。

好的,我明白了每个字母(通常的字符; GC=L),数字(如数字0-9和其他具有数字值的字符; GC=N)和分隔符(分隔符; {{ 1}})。但是很难区分符号(GC=Z),标点符号(GC=S)和标记(GC=P)。

我查了一下它们的清单,但我找不到概念上的区别。这份文件对我帮助不大。这些之间的区别是什么?

1 个答案:

答案 0 :(得分:4)

标记不是独立字符,而是应用于其他字符。在目标字符上显示非间距标记,显示附加到目标字符的间距标记,并在目标字符周围显示封闭标记。例如,这是一个框中的a(字符“a”与封闭的方形字符组合): a⃞

关于标点符号与符号:正如您链接的文字所解释的那样,一些边缘情况被相当任意地分类,但原则上不同之处在于标点符号用于“组织和划分文本单位”(即标记句子的结尾) ,分隔句子的不同部分,将枚举的元素等分开)和符号“表示概念”(例如单位或数学符号)。