连字符在Sphinx中没有正确索引

时间:2018-05-07 13:14:44

标签: sphinx

这与关于括号的问题just posted类似,但具体到足够我认为单独发布以避免混淆是有意义的。

我认为Hyphens在Sphinx中被视为单词分隔符,并且无论如何都会出现意外行为。我尝试了char_setignore_chars等各种解决方案,但效果不佳。

这似乎是一个非常具体的情况,如下:

我制作了一个regexp_filter,将我标题中的两个特定单词合并为一个单词。

regexp_filter=non binding=>nonbinding

这适用于以下标题:

A non binding agreement

但是一旦连字符在术语之前或之后,例如

Discussion-non binding agreements

non binding-or-required agreements

正则表达式失败。

我不确定为什么连字符应该被理解为我所知的单词分隔符和/或空的空间。

0 个答案:

没有答案