这与关于括号的问题just posted类似,但具体到足够我认为单独发布以避免混淆是有意义的。
我认为Hyphens在Sphinx中被视为单词分隔符,并且无论如何都会出现意外行为。我尝试了char_set
和ignore_chars
等各种解决方案,但效果不佳。
这似乎是一个非常具体的情况,如下:
我制作了一个regexp_filter,将我标题中的两个特定单词合并为一个单词。
regexp_filter=non binding=>nonbinding
这适用于以下标题:
A non binding agreement
但是一旦连字符在术语之前或之后,例如
Discussion-non binding agreements
non binding-or-required agreements
正则表达式失败。
我不确定为什么连字符应该被理解为我所知的单词分隔符和/或空的空间。