Question

我正在使用dismax解析器来增强短语查询，如下面的

qf=story_title^5.0+tax_payer_name+judgement_text^1.0+story_description^1.0+tax_payer_name+nature_of_the_issues+decision_summary+additional_comments+facts_of_the_case+section_number';
pf=story_title^5.0+&pf=judgement_text+story_description^1+nature_of_the_issues+decision_summary+additional_comments+facts_of_the_case+section_number';

qs=3';
ps=3';

但每当我搜索 54F beed registration 时，会出现一些结果，其中有更多注册字重复而非 54F beed registration

某处我发现solr得分取决于文档中重复单词的百分比

我们如何覆盖此行为以在solr中实现所需的结果？

提前致谢。

Answer 1

即使已多次提及，我也认为omitTermFreq设置尚未设置。

一种可能的解决方案是通过继承DefaultSimilarity创建自己的相似性类，并返回1.0f作为tf值。

有关如何实现自定义相似性类的信息，请参阅Solr Custom Similarity。最新版本的Solr（4.0+）支持每个字段的自定义相似度类。

单词接近在apache solr中不起作用

1 个答案: