我已经在solr wiki文章中找到了建议者,几乎到了T:http://wiki.apache.org/solr/Suggester。我的solrconfig.xml中有以下xml:
<searchComponent class="solr.SpellCheckComponent" name="suggest">
<lst name="spellchecker">
<str name="name">suggest</str>
<str name="classname">org.apache.solr.spelling.suggest.Suggester</str>
<str name="lookupImpl">org.apache.solr.spelling.suggest.tst.TSTLookup</str>
<str name="field">description</str>
<float name="threshold">0.05</float>
<str name="buildOnCommit">true</str>
</lst>
</searchComponent>
<requestHandler class="org.apache.solr.handler.component.SearchHandler" name="/suggest">
<lst name="defaults">
<str name="spellcheck">true</str>
<str name="spellcheck.dictionary">suggest</str>
<str name="spellcheck.onlyMorePopular">true</str>
<str name="spellcheck.count">5</str>
<str name="spellcheck.collate">true</str>
</lst>
<arr name="components">
<str>suggest</str>
</arr>
</requestHandler>
但是,当我运行以下查询(或类似的东西)时:
../suggest/?q=barbequ
我只得到以下结果xml:
<response>
<lst name="responseHeader">
<int name="status">0</int>
<int name="QTime">78</int>
</lst>
<lst name="spellcheck">
<lst name="suggestions"/>
</lst>
</response>
如您所见,这不是很有帮助。有任何建议可以帮助解决这个问题吗?
答案 0 :(得分:21)
我能想到的一些事情可能会导致这个问题:
源字段(“description”)不正确 - 确保这确实是为您的拼写检查器设置种子条件的字段。甚至可能是该字段是不同的情况(例如“描述”而不是“描述”)。
schema.xml中的源字段未正确设置或正由过滤器处理,导致源字典无效。我使用单独的字段为字典播种,并使用<copyfield />
将相关的其他字段复制到该字段。
术语“烧烤”并未出现在至少5%的记录中(您已通过包含<float name="threshold">0.05</float>
表示此要求),因此未包含在查找词典中
在SpellCheckComponent中,<str name="spellcheck.onlyMorePopular">true</str>
设置意味着只返回会产生更多结果的字词作为建议。根据建议者文档,这有一个不同的功能(按重量排序建议)但是可能值得将其切换为false以查看是否导致问题。
schema.xml的相关部分:
<schema>
<types>
<!-- Field type specifically for spell checking -->
<fieldType name="textSpell" class="solr.TextField" positionIncrementGap="100" omitNorms="true">
<analyzer type="index">
<tokenizer class="solr.StandardTokenizerFactory" />
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
<filter class="solr.LowerCaseFilterFactory" />
<filter class="solr.StandardFilterFactory" />
</analyzer>
<analyzer type="query">
<tokenizer class="solr.StandardTokenizerFactory" />
<filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true" />
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
<filter class="solr.LowerCaseFilterFactory" />
<filter class="solr.StandardFilterFactory" />
</analyzer>
</fieldType>
</types>
<fields>
<field name="spell" type="textSpell" indexed="true" stored="false" multiValued="true" />
</fields>
<!-- Copy fields which are used to seed the spell checker -->
<copyField source="name" dest="spell" />
<copyField source="description" dest="spell" />
<schema>
答案 1 :(得分:6)
问题是你是在查询/suggest
而不是/spell
../suggest/?q=barbequ
在我的设置中,这是我传入的字符串:
/solr/spell?q=barbequ&spellcheck=true&spellcheck.collate=true
第一次进行拼写检查时,您需要包含
&spellcheck.build=true
我正在使用solr 4 btw。所以,也许/建议是一个完全不同的端点,做其他事情。如果是这样,请道歉。
答案 2 :(得分:1)
如果在schema.xml中设置了term-parameter,请检查:
<field name="TEXT" type="text_en" indexed="true" stored="true" multiValued="true"
termVectors="true"
termPositions="true"
termOffsets="true"/>
...重新启动solr并重新重新索引