FastVectorHighlighter短语突出显示不使用词干

时间:2014-06-12 18:42:25

标签: java solr lucene stemming fast-vector-highlighter

尝试编写词干分析器来存储词干和原始词时,使用FastVectorHighlighter导致短语突出显示会出现一些问题。

输入字符串为foo bar bazbabar的词干。下图说明了分析

enter image description here

短语搜索会产生匹配但根本没有突出显示

http://localhost:8080/solr/select
   ?q="foo bar baz"
   &qf=text
   &hl.requireFieldMatch=true
   &hl.fl=text
   &hl.usePhraseHighlighter=true
   &hl.boundaryScanner=breakIterator
   &hl.useFastVectorHighlighter=true
   &hl=true
   &defType=edismax

hl.bs.type=WORD使用boundayScanner的位置。

来自查询的两种方法hl.useFastVectorHighlighter=false和引号都会突出显示所有字词。

正在使用

Solr 3.6.2,该字段定义如下

<field name="text" type="text" indexed="true" stored="true" 
     multiValued="true" termVectors="true" 
     termPositions="true" termOffsets="true"/>

并分析为

<fieldType name="text" class="solr.TextField" positionIncrementGap="100">
    <analyzer>
        <tokenizer class="solr.StandardTokenizerFactory"/>
        <filter class="my.custom.StemmerFactory" preserveOriginal="true"/>
    </analyzer>
</fieldType>

1 个答案:

答案 0 :(得分:3)

原来hl.fragSize没有设置足够大的值来包含整个突出显示的序列。愚蠢的问题通常是最糟糕的。