这些似乎没有索引,即使我明确地将它们添加到我的charset_table:
charset_table=... U+20AC->U+20AC, U+00A3->U+00A3
我甚至尝试将它们映射到美元符号
U+0024->U+0024, U+20AC->U+0024, U+00A3->U+0024
然而在每种情况下,它们都无法识别,换句话说MATCH('£1000')
将找不到“费用为1000英镑”,如果我按照第二个示例尝试映射到$
,那么MATCH('$1000
)``也不会。
如果我进行MySQL搜索where field like '%£%'
我会得到记录,让我相信MySQL正确编码UTF-8。这意味着Pound Sign
和Euro
字符在MySQL中正确存储,但Sphinx索引无法识别它们,即使在我明确地将其Unicode字符添加到charset_table
之后也是如此。
配置的相关部分:
`min_stemming_len = 1
stopword_step = 0
html_strip = 1
min_word_len = 1
min_infix_len = 0
index_zones = title,description
charset_type = utf8mb4_unicode_ci
charset_table = 0..9, A..Z->a..z, _, a..z, U+0026->U+0026, U+0027->U+0027, U+002E->U+002E, U+002D->U+002D, U+2014->U+002D#, U+2019->U+0027, U+0024->U+0024, U+20AC->U+0024, U+00A3->U+0024
确认表/列正在使用utf8mb4_unicode_ci
确认我可以对Euro进行mysql搜索:Where Title like '%€%'
确认我找不到与SphinxQL相同的记录:where MATCH('€')
答案 0 :(得分:0)
你应该检查三件事:
首先,请查看This Question以检查您的MySQL字符编码;
其次,查看您的Sphinx配置,检查charset_type
是否匹配。
最后,请记住,在对charset_type
或charset_table
进行任何更改后,您需要重建索引。
如果上述方法都不起作用,您可以在此处发布Sphinx配置,这可能会为问题提供更多线索。