utf8mb4_unicode_ci
和utf8mb4_danish_ci
(mysql / mariadb数据库)在我的丹麦网站上似乎都可以正常工作。
当我测试字符/符号/表情符号时,它们似乎都显示相同的结果。
丹麦语字母æ/ø/å都可以使用。
为什么我要选择一个字符集/排序规则?
utf8mb4_danish_ci
是否添加字符/代码,或者实际上比utf8mb4_unicode_ci
更窄?
答案 0 :(得分:0)
要区分表情符号并对其排序,我认为您需要utf8mb4_unicode_520_ci
,它基于Unicode 5.20。 utf8mb4_unicode_ci
基于较旧的4.0。 (我不知道_danish_
与Emoji进行比较。)MySQL 8.0将引入9.0版本:utf8mb4_0900_ai_ci
。
对于utf8mb4_danish_ci
:æ/ø/å
之后的每种z
。那就是y > z > æ > ø > å
对于utf8mb4_unicode_ci
,æ
的作用类似于a
和b
'之间的字母; ø
和o
之间的p
; å=a
对于utf8mb4_unicode_520_ci
和utf8mb4_0900_ai_ci
:æ=ae
; ø=o
; å=a
这完全取决于您是否关心上面三个字符如何比较(WHERE
)和排序(ORDER BY
)。
更多详细信息和更多排序规则:http://mysql.rjweb.org/utf8mb4_collations.html
您没有问,但似乎丹麦语说Ä=Æ=ä=æ > Ö=Ø=ö=ø > Aa=Å=å > Þ=þ
;那些似乎迎合了冰岛人和瑞典人。