将unicode字符转换为小写的标准算法是什么?

时间:2010-08-19 13:44:36

标签: string unicode lowercase uppercase

我想知道unicode.org提议的将unicode字符转换为小写的标准算法。

另外,大多数编程语言都遵循这个提议的标准吗?

3 个答案:

答案 0 :(得分:4)

  

我想知道标准算法   用于将unicode字符转换为   unicode.org提出的小写。

基本算法只是连接每个单独字符的小写字母(由UnicodeData.txt中的倒数第二列定义)。还有一些special rules来处理多字符映射(İ→i̇上面有一个额外的COMBINING DOT),条件映射(一个单词的末尾是Σ→ς,否则是σ),以及语言 - 敏感规则(如土耳其无点ı)。

  

此外,做大多数编程语言   遵循这个提议的标准?

Java确实如此。 Python实现了基本规则,但没有实现特殊规则。并且C根本没有标准化的Unicode支持。

答案 1 :(得分:2)

.NET确实具有unicode支持,并提供内置函数以在大小写之间切换。对于其他一些语言来说也是如此。

答案 2 :(得分:1)

编程语言在支持unicode方面有所不同。大多数都没有unicode字符作为内置类型。通常,它可以在库中处理,也可以通过OS调用处理。

例如,C ++没有本机unicode字符类型,但在stl中具有语言环境支持(它被定义为语言的一部分)。 Ada确实有一个本机类型的Wide_Character,以及用于操作它的库支持。