我很困惑她,但我想澄清我的怀疑。我认为这是一个愚蠢的问题,但我想知道。 使用TokenFilter为每个输入令牌输出两个令牌(一个原始和一个小写)。对于查询,客户端需要将包含大写字符的任何搜索项扩展为两个术语,一个是小写的,一个是原始的。原始搜索字词可能会有所提升,但可能没有必要,因为两个字词的匹配都会产生更高的分数。
text:NeXT ==> (text:NeXT^10 OR text:next)
此^
的含义是什么。
http://wiki.apache.org/solr/SolrRelevancyCookbook#Relevancy_and_Case_Matching
答案 0 :(得分:1)
这会在此查询中对NeXT值与下一个值进行比较(对其更重要)。在您链接到的维基页面上“原始搜索字词可能会有所提升,但可能没有必要,因为两个字词的匹配都会产生更高的分数。”
有关Boosting的更多信息,请参阅Boosting Ranking Terms中的Solr Relevancy Cookbook部分。今年早些时候Slide Deck about Boosting的这个Lucene Revolution Conference也包含有关增强功能如何工作以及如何将其应用于各种场景的良好信息。
<强> EDIT1:强> 有关提升值(^后面的数字)的更多信息,请参阅以下内容:
<强> EDIT2:强> 提升值会影响从搜索结果返回的项目的得分/相关性。
(term:NeXT^10 term:next)
- 任何与term:NeXT
匹配的文档在此查询中的评分都会更高/更高,因为它们的推荐值为10。(term:NeXT^10 term:Next^5 term:next)
- 任何与term:NeXT
匹配的文档都会得分最高(因为提升值最高),匹配term:Next
的任何文档的得分都会低于term:NeXT
,但是高于term:next
。