Sphinx中的多对多字形

时间:2017-05-23 19:20:54

标签: search sphinx

在Sphinx中,似乎逻辑上应该使用像实际同义词这样的字形(这提供了多对多的可能性)。例如,我希望搜索字符串中的单词photoimagepicture的任何实例都匹配搜索到的内容中这些单词的任何实例。如果在索引过程中没有返回WARNING: duplicate wordform found - skipped消息,这样的事情是否可能?

1 个答案:

答案 0 :(得分:1)

你可以这样做:

image > photo
picture > photo

单词imagepicture将映射到photo,单词photo将按“原样”处理。

一个例子:

mysql> call keywords('photo image picture', 'idx');
+------+-----------+------------+
| qpos | tokenized | normalized |
+------+-----------+------------+
| 1    | photo     | photo      |
| 2    | image     | photo      |
| 3    | picture   | photo      |
+------+-----------+------------+
3 rows in set (0,00 sec)

您可以看到所有这些字词的正常格式为photo