Solr Tokenizer / Filter没有对链接/标记化的单词进行评分

时间:2015-03-20 10:26:00

标签: solr filter schema tokenize

我在使用solr字段类型时遇到了麻烦,基本上我似乎无法通过类似愚蠢的术语来获得一个不错的分数。


以下是一个例子: 一家名为" Bagelkingdom"

的商店

我有两个记录 - " Bagelkingdom"和" Bagel Kingdom"

当我搜索" Bagelkingdom"我得到14分,它返回" Bagel Kingdom"也是,但只有4分!

当我在" Bagel Kingdom"上进行反向搜索时我得到13分,然后又回归" Bagelkingdom",但这次得分为0.16。


我不会在这里粘贴我的所有架构文件 - 我已经尝试了很多不同的过滤器,而现在的做法并不多。

目前我的过滤器是;

     <fieldType name="text_catenate" class="solr.TextField"  positionIncrementGap="2"  autoGeneratePhraseQueries="true">
  <analyzer>
            <filter class="solr.LowerCaseFilterFactory"/>
            <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1"
                    generateNumberParts="1"
                    catenateWords="1"
                    catenateNumbers="1"
                    catenateAll="1"
                    splitOnCaseChange="0"
                    splitOnNumerics="0"
                    preserveOriginal="1"/>
                    <tokenizer class="solr.KeywordTokenizerFactory"/>
  </analyzer>
</fieldType>

1 个答案:

答案 0 :(得分:1)

也许你可以尝试分析你的分数来解决它。您可以使用例如this tool来观察分数的构建方式。