标签: utf-8 icu
为什么libicu使用utf16作为“共同分母”格式而不是utf8?我需要从utf8转换为utf32然后返回libicu似乎通过要求这两步utf8->utf16->utf32转换使其变得不必要地困难,尽管它有自己的函数,如{{1还需要u_tolower输入。
libicu
utf16
utf8
utf32
utf8->utf16->utf32
u_tolower
似乎记忆不是决定因素,否则他们也可以使用UChar32作为“基础”格式。
UChar32
答案 0 :(得分:0)
UTF-16是Unicode标准的默认编码形式,所以我怀疑它回答了“为什么”。有关其他信息,请参阅this ICU page。