狮身人面像扼杀“挑剔”?

时间:2015-12-11 00:10:47

标签: sphinx stemming

我刚刚安装了en.pak和(根据最近发布的问题)我匹配了

Radiography

Radiograph
Radiographic
Radiograper

然而我再次轮换,现在不知何故它停止了工作。我看到的唯一错误信息是

"WARNING: index 'idx_X': dict=keywords and prefixes and morphology enabled, forcing index_exact_words=1"

我评论了形态学(#)以防万一,但仍然不知何故,突然间放射学只能找到自己。

有趣的更新。我测试了

Run

它找到了

Run
Ran
Running

并在

上测试
Office

它找到了

Office
Offices

但它未能获得

Proctologist

当我搜索

Proctology

我的设置是

morphology = lemmatize_en_all

并安装了en.pak所以是否需要一些'高级'设置来获取像'ology'这样的单词,因为它显然正在获得Ran / Run / Running的基本复数和lems?

1 个答案:

答案 0 :(得分:0)

事实证明,对于我正在寻找的后缀匹配类型而言,lemmatize并不理想,而stem_en是更好的选择。当我改变形态学干燥放射学匹配放射科医师时也与放射线照相匹配