我正在开发一个Web应用程序,并使用Solr作为搜索引擎。我想添加自动完成功能。为此,我添加了Suggester组件,并为其配置了单独的字段。这没问题。
问题是,建议者返回该字段的整个值。例如,如果文章的名称是“有新闻价值的项目”并且我搜索“新”,它将返回整个“有新闻价值的项目”,我希望它返回“有新闻价值”。换句话说,返回单个单词标记。
架构如下所示:
<fieldType name="text_autocomplete" class="solr.TextField" positionIncrementGap="100">
<analyzer>
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
</fieldType>
<field name="term" type="text_autocomplete" indexed="true" stored="true" multiValued="false" />
<field name="weight" type="float" indexed="true" stored="true" />
<copyField source="name" dest="term"/>
将值复制到“term”字段中。 Solr配置:
<!-- Search component -->
<searchComponent name="suggest" class="solr.SuggestComponent">
<lst name="suggester">
<str name="name">suggester</str>
<str name="lookupImpl">AnalyzingLookupFactory</str>
<str name="dictionaryImpl">DocumentDictionaryFactory</str>
<str name="field">term</str>
<str name="weightField">weight</str>
<str name="suggestAnalyzerFieldType">text_autocomplete</str>
<str name="buildOnStartup">false</str>
</lst>
</searchComponent>
<!-- Search handler -->
<requestHandler name="/suggest" class="solr.SearchHandler" startup="lazy">
<lst name="defaults">
<str name="suggest">true</str>
<str name="suggest.count">10</str>
<str name="suggest.dictionary">suggester</str>
<str name="suggest.build">true</str>
</lst>
<arr name="components">
<str>suggest</str>
</arr>
</requestHandler>
任何人都可以建议一个架构和/或配置,使建议器返回一个单词吗?
答案 0 :(得分:1)
而不是solr.SuggestComponent尝试使用solr.SpellCheckComponent。 由于SuggestComponent旨在建议完整的短语。 您可以在此处查看solr.SpellCheckComponent的详细信息。
http://wiki.apache.org/solr/SpellCheckComponent
为了您的快速参考,您可以试试这个。
<searchComponent name="suggest" class="solr.SpellCheckComponent">
<lst name="spellchecker">
<str name="name">suggest</str>
<str name="classname">org.apache.solr.spelling.suggest.Suggester</str>
<str name="lookupImpl">org.apache.solr.spelling.suggest.fst.FSTLookupFactory</str>
<str name="distanceMeasure">org.apache.lucene.search.spell.JaroWinklerDistance</str>
<str name="field">term</str>
<str name="accuracy">0.7</str>
<float name="thresholdTokenFrequency">.0001</float>
</lst>
</searchComponent>