Unicode字符组合拉丁文小写字母C.

时间:2013-03-06 18:00:02

标签: unicode icu

我在“现实生活”中遇到COMBINING LATIN SMALL LETTER C (U+0368)的可能性有多大(clever Scottish folk除外)?

我问,因为Unicode Block Combining Diacritical MarksCategory Mark, Nonspacing [Mn]都有。

因此,它似乎被COMBINING GRAVE ACCENT (U+0300)之类的公用事业处理为与ICU Transliterator等字符相同(使用建议的"NFD; [:Nonspacing Mark:] Remove; NFC"或直的"Latin-ASCII" }音译)。

2 个答案:

答案 0 :(得分:2)

可能性是完全不确定的,除非说如果你预期它不会发生,那么它就会发生。

答案 1 :(得分:1)

可能性非常接近零,但不完全为零。你不能阻止任何人使用他喜欢的Unicode字符。 Unicode标准中没有关于U + 0368的具体信息,但它肯定被定义为一个组合字符,它将使符号(c)显示在前一个字符之上。我希望它主要以中世纪手稿的数字化形式或类似的形式发现。

在空格字符之后使用它,就像在上面提到的“聪明”页面中一样,不是预期的用途,也不是无效的。 Unicode允许您在任何字符后使用任何组合标记,无论它是否有意义。

它没有规范或兼容性分解,因此在您不能或不想保留角色的上下文中没有明确的方法来处理。