Solr / Lucene基于多个字段的拼写检查建议

时间:2011-09-02 18:41:07

标签: lucene solr spell-checking

我有一个包含供应商信息的数据库:名称和地址(地址,城市,邮编和国家/地区)。我需要搜索这个数据库并返回一些供应商。在搜索框中,用户可以输入任何内容:供应商的名称,地址的一部分,城市,邮政编码......如果我找不到任何结果,我需要像谷歌一样实施“你的意思是“向用户提供建议的功能。

我想过使用Solr / Lucene来做这件事。我已经安装了Solr,使用CSV文件导出了我需要的信息,并根据此文件创建了索引。现在,我可以使用solr.SpellCheckComponent从Solr字段获取建议。问题是我的建议是基于一个字段,需要它来从地址,城市,邮编,国家和名称字段中获取信息。

在solr配置文件中我有这样的东西:

<searchComponent name="spellcheck" class="solr.SpellCheckComponent">
<str name="queryAnalyzerFieldType">textSpell</str>

<lst name="spellchecker">
    <str name="name">default</str>
    <str name="field">name</str>
    <str name="spellcheckIndexDir">spellchecker</str>
</lst>
</searchComponent>

<requestHandler name="/spell" class="solr.SearchHandler" startup="lazy">
    <lst name="defaults">
        <str name="spellcheck.onlyMorePopular">false</str>
        <str name="spellcheck.extendedResults">false</str>
        <str name="spellcheck.count>1</str>
    </lst>
    <arr name="last-components">
        <str>spellcheck</str>
    </arr>
</requestHandler>

我可以运行以下查询:

http://localhost:8983/solr/spell?q=some_company_name&spellcheck=true&spellcheck.collate=true&spellcheck.build=true

有谁知道如何更改配置文件以获得多个字段的建议?

感谢!!!

2 个答案:

答案 0 :(得分:6)

您在schema.xml中使用copyfield。<copyField source="*" dest="contentSpell"/>会将所有字段复制到contentSpell。

然后将<str name="field">name</str>更改为<str name="field">contentSpell</str>,您将获得所有字段的建议。

答案 1 :(得分:6)

为了将Solr拼写检查配置为使用来自多个字段的单词,您应该:

  1. 声明一个新字段。新字段声明应使用属性type =“textSpell”和multiValued =“true”。例如:<field name="didYouMean" type="textSpell" indexed="true" multiValued="true"/>
  2. 将所有字段(其中的单词应该是拼写检查索引的一部分)复制到新字段中。例如:<copyField source="field1" dest="didYouMean"/> <copyField source="field2" dest="didYouMean"/>
  3. 配置Solr以使用新字段。通过设置字段名称来使用拼​​写检查字段名称来实现。例如:<str name="field">didYouMean</str>
  4. 有关更多详细信息,请访问Solr spellcheck compound from several fields