为什么NFKC标准化失去上标&下标信息?

时间:2018-04-26 21:09:01

标签: unicode text-normalization

我注意到在将Unicode字符串规范化为NFKC格式时,上标字符如¹(U + 00B9),²(U + 00B2),³(U + 00B3)等转换为相应的ASCII数字(例如123等。)

有谁知道这种行为的理由?看起来它在这个过程中丢失了信息。例如,上标数字通常具有一些上下文含义。

0 个答案:

没有答案