单词接近在apache solr中不起作用

时间:2016-05-20 13:23:45

标签: solr lucene

我正在使用dismax解析器来增强短语查询,如下面的

qf=story_title^5.0+tax_payer_name+judgement_text^1.0+story_description^1.0+tax_payer_name+nature_of_the_issues+decision_summary+additional_comments+facts_of_the_case+section_number';
pf=story_title^5.0+&pf=judgement_text+story_description^1+nature_of_the_issues+decision_summary+additional_comments+facts_of_the_case+section_number';

qs=3';
ps=3';

但每当我搜索 54F beed registration 时,会出现一些结果,其中有更多注册字重复而非 54F beed registration

某处我发现solr得分取决于文档中重复单词的百分比

我们如何覆盖此行为以在solr中实现所需的结果?

提前致谢。

1 个答案:

答案 0 :(得分:0)

即使已多次提及,我也认为omitTermFreq设置尚未设置。

一种可能的解决方案是通过继承DefaultSimilarity创建自己的相似性类,并返回1.0f作为tf值。

有关如何实现自定义相似性类的信息,请参阅Solr Custom Similarity。最新版本的Solr(4.0+)支持每个字段的自定义相似度类。