在Sphinx

时间:2017-04-12 23:12:03

标签: sphinx

这些似乎没有索引,即使我明确地将它们添加到我的charset_table:

charset_table=...  U+20AC->U+20AC, U+00A3->U+00A3

我甚至尝试将它们映射到美元符号

U+0024->U+0024, U+20AC->U+0024, U+00A3->U+0024

然而在每种情况下,它们都无法识别,换句话说MATCH('£1000')将找不到“费用为1000英镑”,如果我按照第二个示例尝试映射到$,那么MATCH('$1000 )``也不会。

如果我进行MySQL搜索where field like '%£%'我会得到记录,让我相信MySQL正确编码UTF-8。这意味着Pound SignEuro字符在MySQL中正确存储,但Sphinx索引无法识别它们,即使在我明确地将其Unicode字符添加到charset_table之后也是如此。

配置的相关部分:

`min_stemming_len = 1
stopword_step = 0
html_strip  = 1
min_word_len = 1
min_infix_len = 0
index_zones = title,description
charset_type = utf8mb4_unicode_ci
charset_table = 0..9, A..Z->a..z, _, a..z, U+0026->U+0026, U+0027->U+0027, U+002E->U+002E, U+002D->U+002D, U+2014->U+002D#, U+2019->U+0027, U+0024->U+0024, U+20AC->U+0024, U+00A3->U+0024

确认表/列正在使用utf8mb4_unicode_ci

确认我可以对Euro进行mysql搜索:Where Title like '%€%'

确认我找不到与SphinxQL相同的记录:where MATCH('€')

1 个答案:

答案 0 :(得分:0)

你应该检查三件事:

首先,请查看This Question以检查您的MySQL字符编码;

其次,查看您的Sphinx配置,检查charset_type是否匹配。

最后,请记住,在对charset_typecharset_table进行任何更改后,您需要重建索引。

如果上述方法都不起作用,您可以在此处发布Sphinx配置,这可能会为问题提供更多线索。