拉丁语和俄语翻译仍然正常搜索(!)
$ search sumka
using config file '/etc/sphinx/sphinx.conf'...
index 'test1': query 'sumka ': returned 636 matches of 636 total in 0.000 sec
displaying matches:
1. document=154143, weight=1660, name=Сумка Sony LCS-MS10 Gray Alpha Текстильная сумка для фотокамеры Alpha Серый цвет, casual style (сумка почтальона) [LCSMS10H.AE], description_short=Сумка Sony LCS-MS10 Gray Alpha Текстильная сумка для фотокамеры Alpha Серый цвет, casual style (сумка почтальона) [LCSMS10H.AE]
...
$ search сумка
using config file '/etc/sphinx/sphinx.conf'...
index 'test1': query 'сумка ': returned 0 matches of 0 total in 0.000 sec
words:
1. 'сумка': 0 documents, 0 hits
听起来像charset问题,但我在mysql和查询中有utf8
mysql> show variables like "character%";
+--------------------------+----------------------------+
| Variable_name | Value |
+--------------------------+----------------------------+
| character_set_client | utf8 |
| character_set_connection | utf8 |
| character_set_database | utf8 |
| character_set_filesystem | binary |
| character_set_results | utf8 |
| character_set_server | utf8 |
| character_set_system | utf8 |
| character_sets_dir | /usr/share/mysql/charsets/ |
+--------------------------+----------------------------+
mysql> show variables like "collation%";
+----------------------+-----------------+
| Variable_name | Value |
+----------------------+-----------------+
| collation_connection | utf8_general_ci |
| collation_database | utf8_general_ci |
| collation_server | utf8_unicode_ci |
+----------------------+-----------------+
$ file words
words: UTF-8 Unicode text
$ cat words | search --stdin
using config file '/etc/sphinx/sphinx.conf'...
index 'test1': query 'сумка
': returned 0 matches of 0 total in 0.000 sec
words:
1. 'сумка': 0 documents, 0 hits
对于php客户端和像客户端一样的sphinx mysql也是如此。
完整的狮身人面像配置是here,但引用了有意义的部分:
source src1
{
...
sql_query_pre = SET NAMES utf8
sql_query_pre = SET CHARACTER SET utf8
...
}
index test1
{
...
charset_type = utf-8
...
}
我发现只有一个类似的问题,但db中有latin1字符集。
程序版本是:
mysql Ver 14.14 Distrib 5.5.20, for Linux (x86_64) using readline 5.1
Sphinx 2.0.6-id64-release (r3473)
centos 5.8
使用来自http://sphinxsearch.com/wiki/doku.php?id=charset_tables#cyrillic的表格将charset_table添加到配置中,但仍然不行。
我还在我的本地gentoo上安装了Sphinx 2.0.5-release(r3308),它可以解决开箱即用的西里尔语问题。
答案 0 :(得分:0)
你可以试试mysql界面吗? (mysql -P 9306 -h 127.0.0.1再做一个 SELECT * FROM test1 WHERE MATCH('сумка'); )
答案 1 :(得分:0)
它现在有效。
我不清楚它是什么,但是它使用默认配置和带有西里尔字母行的example.sql,所以我将数据库转储并填充它并使其工作。 我认为它修复了一些编码问题,可能是在迁移后抛出几个mysql实例。
抱歉我的纯英语。:)
答案 2 :(得分:0)
问题可能是由于mysql编码。尝试取消注释这一行:
#sql_query_pre = SET NAMES utf8
mysql的默认编码可能与utf8;
不同