solr建议者没有返回任何结果

时间:2011-07-11 16:15:39

标签: solr spell-checking autosuggest

我已经在solr wiki文章中找到了建议者,几乎到了T:http://wiki.apache.org/solr/Suggester。我的solrconfig.xml中有以下xml:

<searchComponent class="solr.SpellCheckComponent" name="suggest"> 
     <lst name="spellchecker"> 
     <str name="name">suggest</str> 
     <str name="classname">org.apache.solr.spelling.suggest.Suggester</str> 
     <str name="lookupImpl">org.apache.solr.spelling.suggest.tst.TSTLookup</str> 
     <str name="field">description</str> 
     <float name="threshold">0.05</float> 
     <str name="buildOnCommit">true</str> 
   </lst> 
</searchComponent> 
<requestHandler class="org.apache.solr.handler.component.SearchHandler" name="/suggest"> 
   <lst name="defaults"> 
     <str name="spellcheck">true</str> 
     <str name="spellcheck.dictionary">suggest</str> 
     <str name="spellcheck.onlyMorePopular">true</str> 
     <str name="spellcheck.count">5</str> 
     <str name="spellcheck.collate">true</str> 
   </lst> 
   <arr name="components"> 
     <str>suggest</str> 
   </arr> 
</requestHandler> 

但是,当我运行以下查询(或类似的东西)时:

../suggest/?q=barbequ

我只得到以下结果xml:

<response>
   <lst name="responseHeader">
      <int name="status">0</int>
      <int name="QTime">78</int>
   </lst>
   <lst name="spellcheck">
      <lst name="suggestions"/>
   </lst>
</response>

如您所见,这不是很有帮助。有任何建议可以帮助解决这个问题吗?

3 个答案:

答案 0 :(得分:21)

我能想到的一些事情可能会导致这个问题:

  • 源字段(“description”)不正确 - 确保这确实是为您的拼写检查器设置种子条件的字段。甚至可能是该字段是不同的情况(例如“描述”而不是“描述”)。

  • schema.xml中的源字段未正确设置或正由过滤器处理,导致源字典无效。我使用单独的字段为字典播种,并使用<copyfield />将相关的其他字段复制到该字段。

  • 术语“烧烤”并未出现在至少5%的记录中(您已通过包含<float name="threshold">0.05</float>表示此要求),因此未包含在查找词典中

  • 在SpellCheckComponent中,<str name="spellcheck.onlyMorePopular">true</str>设置意味着只返回会产生更多结果的字词作为建议。根据建议者文档,这有一个不同的功能(按重量排序建议)但是可能值得将其切换为false以查看是否导致问题。

schema.xml的相关部分:

<schema>
    <types>
        <!-- Field type specifically for spell checking -->
        <fieldType name="textSpell" class="solr.TextField" positionIncrementGap="100" omitNorms="true">
            <analyzer type="index">
                <tokenizer class="solr.StandardTokenizerFactory" />
                <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
                <filter class="solr.LowerCaseFilterFactory" />
                <filter class="solr.StandardFilterFactory" />
            </analyzer>
            <analyzer type="query">
                <tokenizer class="solr.StandardTokenizerFactory" />
                <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true" />
                <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
                <filter class="solr.LowerCaseFilterFactory" />
                <filter class="solr.StandardFilterFactory" />
            </analyzer>
        </fieldType>
    </types>
    <fields>
        <field name="spell" type="textSpell" indexed="true" stored="false" multiValued="true" />
    </fields>

    <!-- Copy fields which are used to seed the spell checker -->
    <copyField source="name" dest="spell" />
    <copyField source="description" dest="spell" />
<schema>

答案 1 :(得分:6)

问题是你是在查询/suggest而不是/spell

../suggest/?q=barbequ

在我的设置中,这是我传入的字符串:

/solr/spell?q=barbequ&spellcheck=true&spellcheck.collate=true

第一次进行拼写检查时,您需要包含

&spellcheck.build=true

我正在使用solr 4 btw。所以,也许/建议是一个完全不同的端点,做其他事情。如果是这样,请道歉。

答案 2 :(得分:1)

如果在schema.xml中设置了term-parameter,请检查:

<field name="TEXT" type="text_en" indexed="true" stored="true" multiValued="true" 
                   termVectors="true"
                   termPositions="true"
                   termOffsets="true"/>

...重新启动solr并重新重新索引