我在“现实生活”中遇到COMBINING LATIN SMALL LETTER C (U+0368)的可能性有多大(clever Scottish folk除外)?
我问,因为Unicode Block Combining Diacritical Marks和Category Mark, Nonspacing [Mn]都有。
因此,它似乎被COMBINING GRAVE ACCENT (U+0300)之类的公用事业处理为与ICU Transliterator等字符相同(使用建议的"NFD; [:Nonspacing Mark:] Remove; NFC"
或直的"Latin-ASCII"
}音译)。
答案 0 :(得分:2)
可能性是完全不确定的,除非说如果你预期它不会发生,那么它就会发生。
答案 1 :(得分:1)
可能性非常接近零,但不完全为零。你不能阻止任何人使用他喜欢的Unicode字符。 Unicode标准中没有关于U + 0368的具体信息,但它肯定被定义为一个组合字符,它将使符号(c)显示在前一个字符之上。我希望它主要以中世纪手稿的数字化形式或类似的形式发现。
在空格字符之后使用它,就像在上面提到的“聪明”页面中一样,不是预期的用途,也不是无效的。 Unicode允许您在任何字符后使用任何组合标记,无论它是否有意义。
它没有规范或兼容性分解,因此在您不能或不想保留角色的上下文中没有明确的方法来处理。