MySQL utf8_general字符映射表

时间:2009-09-14 09:52:19

标签: php mysql unicode

根据我的理解,当MySQL比较存储在utf8_general排序规则中的字符串时,它首先将其字符转换为它们的ASCII等价物。换句话说,ḩ= h,ţ= t,ā= a,í= i,等......

是否有一个映射表可用于在php或JavaScript中实现类似的比较功能?我知道PHP中有替代方案,但iconv但它们的音译略有不同,例如: í='我。

谢谢。

1 个答案:

答案 0 :(得分:1)

通常的做法是将字符串规范化为Unicode Normal Form D(将变音符号放在单独的字符中作为基本字母),然后使用unicode“组合变音”类删除所有字符。

请参阅normalizer_normalize以获得PHP的规范化。我不知道JavaScript的解决方案:没有内置任何东西,你必须强迫客户端吸收一些大的Unicode字符数据表。