utf8mb4_unicode_ci或utf8mb4_danish_ci

时间:2018-07-18 03:44:19

标签: php mysql utf-8 character-encoding utf8mb4

utf8mb4_unicode_ciutf8mb4_danish_ci(mysql / mariadb数据库)在我的丹麦网站上似乎都可以正常工作。

当我测试字符/符号/表情符号时,它们似乎都显示相同的结果。
丹麦语字母æ/ø/å都可以使用。

为什么我要选择一个字符集/排序规则?

utf8mb4_danish_ci是否添加字符/代码,或者实际上比utf8mb4_unicode_ci更窄?

1 个答案:

答案 0 :(得分:0)

要区分表情符号并对其排序,我认为您需要utf8mb4_unicode_520_ci,它基于Unicode 5.20。 utf8mb4_unicode_ci基于较旧的4.0。 (我不知道_danish_与Emoji进行比较。)MySQL 8.0将引入9.0版本:utf8mb4_0900_ai_ci

对于utf8mb4_danish_ciæ/ø/å之后的每种z。那就是y > z > æ > ø > å

对于utf8mb4_unicode_ciæ的作用类似于ab'之间的字母; øo之间的på=a

对于utf8mb4_unicode_520_ciutf8mb4_0900_ai_ciæ=aeø=o; å=a

这完全取决于您是否关心上面三个字符如何比较(WHERE)和排序(ORDER BY)。

更多详细信息和更多排序规则:http://mysql.rjweb.org/utf8mb4_collations.html

您没有问,但似乎丹麦语Ä=Æ=ä=æ > Ö=Ø=ö=ø > Aa=Å=å > Þ=þ;那些似乎迎合了冰岛人和瑞典人。