Sphinx - 如何只索引有限数量的单词?

时间:2012-06-06 07:01:12

标签: full-text-search search-engine sphinx

我的行业数量有限(约有300个行业),我想创建一个索引,在索引文档中给出这些关键字的频率。在狮身人面像中有没有办法做到这一点?

2 个答案:

答案 0 :(得分:0)

不是真的。

但索引器的--buildstops函数会生成索引中最常用的关键字列表。

因此,只需查看其输出,并与您的行业列表进行比较。从理论上讲,我认为你的行业应该在列表的顶端,所以不必太久。

答案 1 :(得分:0)

Sphinx中有一个技巧可以从索引中获取关键字统计信息。设置了 hits 标记的BuildKeywords API调用(http://sphinxsearch.com/docs/current.html#api-func-buildkeywords)将返回给定索引的每个关键字频率。

希望这有帮助