Pphinx中的管道与显式表达式性能问题

时间:2015-12-22 00:34:25

标签: performance sphinx

由于我没有足够全面的表格来测试我对Sphinx和Pipes / Or与显式排列的一般性能问题。换句话说,它们之间存在性能差异:

(A|B|C|)(1|2|3|)

VS

(A1|A2|A3|B1|B2|B3|C1|C2|C3)

因为在一天结束时他们会搜索相同的排列?

1 个答案:

答案 0 :(得分:0)

要使(A|B|C)(1|2|3)正常工作,您需要为索引设置min_word_len = 1,这会增加索引大小并可能会略微影响性能。

对于(A1|A2|A3|B1|B2|B3|C1|C2|C3),您需要min_word_len = 2,这将减少索引大小。

但如果您已经拥有min_word_len = 1,那么这些不应影响效果。

请确保(A|B|C)(1|2|3)正在搜索(A OR B OR C) AND (1 OR 2 OR 3),因此它并不总是在寻找相邻的字词。因此,更好的使用方法是(A1|A2|A3|B1|B2|B3|C1|C2|C3)

由于