我无法理解一些概念。在Unicode规范中,有一个名为general category的属性。
好的,我明白了每个字母(通常的字符; GC=L
),数字(如数字0-9和其他具有数字值的字符; GC=N
)和分隔符(分隔符; {{ 1}})。但是很难区分符号(GC=Z
),标点符号(GC=S
)和标记(GC=P
)。
我查了一下它们的清单,但我找不到概念上的区别。这份文件对我帮助不大。这些之间的区别是什么?
答案 0 :(得分:4)
标记不是独立字符,而是应用于其他字符。在目标字符上显示非间距标记,显示附加到目标字符的间距标记,并在目标字符周围显示封闭标记。例如,这是一个框中的a(字符“a”与封闭的方形字符组合): a⃞
关于标点符号与符号:正如您链接的文字所解释的那样,一些边缘情况被相当任意地分类,但原则上不同之处在于标点符号用于“组织和划分文本单位”(即标记句子的结尾) ,分隔句子的不同部分,将枚举的元素等分开)和符号“表示概念”(例如单位或数学符号)。