从Solr Suggester

时间:2016-09-20 12:07:03

标签: solr autocomplete solr-schema solrconfig

我正在开发一个Web应用程序,并使用Solr作为搜索引擎。我想添加自动完成功能。为此,我添加了Suggester组件,并为其配置了单独的字段。这没问题。

问题是,建议者返回该字段的整个值。例如,如果文章的名称是“有新闻价值的项目”并且我搜索“新”,它将返回整个“有新闻价值的项目”,我希望它返回“有新闻价值”。换句话说,返回单个单词标记。

架构如下所示:

<fieldType name="text_autocomplete" class="solr.TextField" positionIncrementGap="100">
  <analyzer>
    <tokenizer class="solr.WhitespaceTokenizerFactory"/>
    <filter class="solr.LowerCaseFilterFactory"/>
  </analyzer>
</fieldType>

<field name="term" type="text_autocomplete" indexed="true" stored="true" multiValued="false" />
<field name="weight" type="float" indexed="true" stored="true" />

<copyField source="name" dest="term"/>

将值复制到“term”字段中。 Solr配置:

<!-- Search component -->
<searchComponent name="suggest" class="solr.SuggestComponent">
  <lst name="suggester">
    <str name="name">suggester</str>
    <str name="lookupImpl">AnalyzingLookupFactory</str>
    <str name="dictionaryImpl">DocumentDictionaryFactory</str>
    <str name="field">term</str>
    <str name="weightField">weight</str>
    <str name="suggestAnalyzerFieldType">text_autocomplete</str>
    <str name="buildOnStartup">false</str>
  </lst>
</searchComponent>

<!-- Search handler -->
<requestHandler name="/suggest" class="solr.SearchHandler" startup="lazy">
  <lst name="defaults">
    <str name="suggest">true</str>
    <str name="suggest.count">10</str>
    <str name="suggest.dictionary">suggester</str>
    <str name="suggest.build">true</str>
  </lst>
  <arr name="components">
    <str>suggest</str>
  </arr>
</requestHandler>

任何人都可以建议一个架构和/或配置,使建议器返回一个单词吗?

1 个答案:

答案 0 :(得分:1)

而不是solr.SuggestComponent尝试使用solr.SpellCheckComponent。 由于SuggestComponent旨在建议完整的短语。 您可以在此处查看solr.SpellCheckComponent的详细信息。

http://wiki.apache.org/solr/SpellCheckComponent

为了您的快速参考,您可以试试这个。

<searchComponent name="suggest" class="solr.SpellCheckComponent">
<lst name="spellchecker">
    <str name="name">suggest</str>
    <str name="classname">org.apache.solr.spelling.suggest.Suggester</str>
    <str name="lookupImpl">org.apache.solr.spelling.suggest.fst.FSTLookupFactory</str>
    <str name="distanceMeasure">org.apache.lucene.search.spell.JaroWinklerDistance</str>
    <str name="field">term</str>
    <str name="accuracy">0.7</str>
    <float name="thresholdTokenFrequency">.0001</float>

</lst>
</searchComponent>