我想知道unicode.org提议的将unicode字符转换为小写的标准算法。
另外,大多数编程语言都遵循这个提议的标准吗?
答案 0 :(得分:4)
我想知道标准算法 用于将unicode字符转换为 unicode.org提出的小写。
基本算法只是连接每个单独字符的小写字母(由UnicodeData.txt中的倒数第二列定义)。还有一些special rules来处理多字符映射(İ→i̇上面有一个额外的COMBINING DOT),条件映射(一个单词的末尾是Σ→ς,否则是σ),以及语言 - 敏感规则(如土耳其无点ı)。
此外,做大多数编程语言 遵循这个提议的标准?
Java确实如此。 Python实现了基本规则,但没有实现特殊规则。并且C根本没有标准化的Unicode支持。
答案 1 :(得分:2)
.NET确实具有unicode支持,并提供内置函数以在大小写之间切换。对于其他一些语言来说也是如此。
答案 2 :(得分:1)
编程语言在支持unicode方面有所不同。大多数都没有unicode字符作为内置类型。通常,它可以在库中处理,也可以通过OS调用处理。
例如,C ++没有本机unicode字符类型,但在stl中具有语言环境支持(它被定义为语言的一部分)。 Ada确实有一个本机类型的Wide_Character,以及用于操作它的库支持。