Apache Solr构面搜索排除空间

时间:2014-12-05 12:46:49

标签: php solr facet

我正在使用Apache Solr并使用以下查询进行搜索

http://Siteurl:8080/solr/metro/select?q=*:*&rows=0&wt=json&indent=true&facet=true&facet.field=Make

但结果让我假设我在制造领域有'福特嘉年华'。我得到两个结果而不是一个,如下所示:

Ford => 21
Fiesta => 21

它是按空间划分的。

我希望它像

Ford Fiesta => 21

请告诉我这样做的有效方法。

由于

1 个答案:

答案 0 :(得分:4)

这里的问题非常简单。您正试图在标记化字段(文本)上进行分面。这意味着每个令牌将被单独计算。我建议您添加新字段(在schema.xml文件中),您将使用与字段Make相同的数据来提供该字段(例如,使用复制字段)。这个新字段应该是KeywordTokenizer的字符串或文本。

请看下面的例子。我添加了两种类型:string和text_not_tokenized。然后定义了两个字段Make_string和Make_nonTokenized。当你面对每一个时,你应该看到"福特嘉年华"

所以你可以查询

http://Siteurl:8080/solr/metro/select?q=*:*&rows=0&wt=json&indent=true&facet=true&facet.field=Make_string

http://Siteurl:8080/solr/metro/select?q=*:*&rows=0&wt=json&indent=true&facet=true&facet.field=Make_nonTokenized

...
<fieldType name="string" class="solr.StrField" sortMissingLast="true" />
<fieldType name="text_not_tokenized" class="solr.TextField">
  <analyzer>
    <tokenizer class="solr.KeywordTokenizerFactory"/>
  </analyzer>
</fieldType>
...
<field name="Make_string" type="string">
<field name="Make_nonTokenized" type="text_not_tokenized">
....