应用错误收集

为什么NFKC标准化失去上标＆amp;下标信息？

时间：2018-04-26 21:09:01

标签： unicode text-normalization

我注意到在将Unicode字符串规范化为NFKC格式时，上标字符如¹（U + 00B9），²（U + 00B2），³（U + 00B3）等转换为相应的ASCII数字（例如1，2，3等。）

有谁知道这种行为的理由？看起来它在这个过程中丢失了信息。例如，上标数字通常具有一些上下文含义。

0 个答案:

没有答案