我创建了一个在线商店,我注意到搜索功能存在问题。
如果用户输入要搜索的字符串,我会执行SELECT * FROM PRODUCTS WHERE DESCRIPTION LIKE %....%
这很好用,但特殊字符中存在问题。想象一下,我有“préparé”或“côteàl'os”等产品。当用户搜索“准备”或“cote a l'os”时,将无法找到产品,但他们仍在那里。
问题还在于另一种方式。如果用户搜索“dûroc”但我的产品在数据库中为“duroc”,他将无法找到它。
它也可以介于两者之间:用户搜索“preparé”或“côteal'os”。
如何解决此问题,或者至少缩小它?
MySQL 5.1.73 / PHP 5.6
更新
我在阅读了给定的答案后做了一些额外的测试,我可以提供一些额外的细节。
如果我使用像MySQL Workbench或Sequel Pro这样的工具,那一切都运行得很好。所以我可以执行SELECT * FROM PRODUCTS WHERE DESCRIPTION LIKE '%prepare%'
或SELECT * FROM PRODUCTS WHERE DESCRIPTION LIKE '%preparé%'
;它们都返回描述中包含“准备”,“préparé”或“preparé”的所有记录,完全按照我的意愿。
我不知道MySQL是这样做的,因为SQL Server没有(只是测试过它)
然后回到网站。如果用户键入“准备”,它仍然顺利,所有记录都返回如上。 但是,如果用户键入“preparé”,则不会返回任何内容,甚至不会返回说明中包含“preparé”的内容。
这是我使用的PHP查询:
$qryPLU = sprintf(SELECT * FROM PRODUCTS WHERE DESCRIPTION LIKE "%%%s%%", $conn->real_escape_string($mywgid));
当我回应这个时,我得到:
SELECT * FROM PRODUCTS WHERE DESCRIPTION LIKE '%PREPARé%'
因此,我认为,在某种程度上我会改变数据库,但我不知道如何,在哪里或为何。
不知怎的,@ Reversal正朝着我现在看到的正确方向前进。
答案 0 :(得分:1)
这可能与您的charset
和collation
。
mysql> set names latin1;
Query OK, 0 rows affected (0.00 sec)
mysql> select 'préparé' like '%prepare%';
+------------------------------+
| 'préparé' like '%prepare%' |
+------------------------------+
| 0 |
+------------------------------+
1 row in set (0.00 sec)
mysql> set names utf8;
Query OK, 0 rows affected (0.00 sec)
mysql> select 'préparé' like '%prepare%';
+------------------------------+
| 'préparé' like '%prepare%' |
+------------------------------+
| 1 |
+------------------------------+
1 row in set (0.00 sec)
答案 1 :(得分:1)
这似乎对我有用:
SELECT _utf32 'préparé' = _utf32 'prepare' collate utf32_general_ci;
+--------------------------------------------------------------+
| _utf32 'pr?par?' = _utf32 'prepare' collate utf32_general_ci |
+--------------------------------------------------------------+
| 1 |
+--------------------------------------------------------------+
select _utf32 "côte à l'os" = _utf32 "cote a l'os" collate utf32_general_ci;
+----------------------------------------------------------------------+
| _utf32 "c?te ? l'os" = _utf32 "cote a l'os" collate utf32_general_ci |
+----------------------------------------------------------------------+
| 1 |
+----------------------------------------------------------------------+
答案 2 :(得分:1)
尝试使用iconv将php变量/参数转换为ISO-8859-1:
iconv('UTF-8', 'ISO-8859-1//TRANSLIT//IGNORE', $variable)