Question

首先让我们看看我是否做得对：

charset是一组符号和编码。排序规则是一组用于比较字符集中字符的规则。

我应该使用utf8mb4，因为mysql utf8是一个欺诈，最多3个字节而不是PHP中真正的4字节真实utf8字符集。

因此，utf8mb4是一个字符集，utf8mb4_unicode_ci / utf8mb4_bin是他的许多不同的可用校对中的两个。

utf8_unicode_ci进行不区分大小写的比较和其他特殊比较（我听说它与法语中的所有口音混淆）。 utf8_bin区分大小写，因为它比较了字符的二进制值。

现在问题：

例如，如果我想使用utf8mb4_unicode_ci允许区分大小写的登录名，我将不得不这样做：
```
SELECT name FROM table WHERE BINARY name = 'MyNaMEiSFUlloFUPPERCases';
```
例如，如果我想使用utf8mb4_bin允许不区分大小写的搜索，我将不得不执行以下操作：
```
SELECT name FROM table WHERE LOWER(name) LIKE '%myname%'
```
哪一个更好？我听说过关于utf8_unicode_ci和口音/其他特殊字符的坏事怎么样？

谢谢：）

Answer 1

你做得对吗＆＃34;？是的，除了我认为法语口音是正确的＆＃39;比较在utf8mb4_unicode_520_ci。

您的两个SELECTs将进行全表扫描，因此效率低下。原因是您要覆盖排序规则（对于＃1）或将列隐藏在函数（LOWER中，对于＃2）或使用前导通配符（LIKE %...）。

如果您希望它有效率，请将name声明为COLLATION utf8mb4_bin并简单地WHERE name = ...。

你认为其中一些等价和排序是否不正确＆＃39;为法国人？

A=a=ª=À=Á=Â=Ã=Ä=Å=à=á=â=ã=ä=å=Ā=ā=Ą=ą  Aa  ae=Æ=æ  az  B=b  C=c=Ç=ç=Ć=ć=Č=č  ch  cz
D=d=Ð=ð=Ď=ď  dz  E=e=È=É=Ê=Ë=è=é=ê=ë=Ē=ē=Ĕ=ĕ=Ė=ė=Ę=ę=Ě=ě  F=f  fz  ƒ  G=g=Ğ=ğ=Ģ=ģ
gz  H=h  hz  I=i=Ì=Í=Î=Ï=ì=í=î=ï=Ī=ī=Į=į=İ  ij=ĳ  iz  ı  J=j  K=k=Ķ=ķ
L=l=Ĺ=ĺ=Ļ=ļ=Ł=ł  lj=Ǉ=ǈ=ǉ  ll  lz  M=m  N=n=Ñ=ñ=Ń=ń=Ņ=ņ=Ň=ň  nz
O=o=º=Ò=Ó=Ô=Õ=Ö=Ø=ò=ó=ô=õ=ö=ø  oe=Œ=œ  oz  P=p  Q=q  R=r=Ř=ř  S=s=Ś=ś=Ş=ş=Š=š  sh
ss=ß  sz  T=t=Ť=ť  TM=tm=™  tz  U=u=Ù=Ú=Û=Ü=ù=ú=û=ü=Ū=ū=Ů=ů=Ų=ų  ue  uz  V=v  W=w  X=x
Y=y=Ý=ý=ÿ=Ÿ  yz  Z=z=Ź=ź=Ż=ż=Ž=ž  zh  zz  Þ=þ  µ

More utf8 collations

＆＃34; 520＆＃34; （较新的）版本，不将Æ，Ð，Ł和Ø视为单独的字母＆＃39;以及其他可能的事情。

Answer 2

例如，如果我想允许使用utf8mb4_bin进行不区分大小写的搜索，则必须执行以下操作：

请记住，如果您使用LOWER，它将忽略索引编制

utf8mb4_unicode_ci vs utf8mb4_bin

2 个答案: