使用逗号分隔的字段值进行Solr分组

时间:2014-05-29 19:02:06

标签: solr fieldcollapsing

我有一个逗号分隔的字段值,名为'Categories',我已编入索引&使用定义为:

的自定义字段类型存储
<fieldType name="text_comma_delimited" class="solr.TextField">
      <analyzer>
        <tokenizer class="solr.PatternTokenizerFactory" pattern="," />
      </analyzer>
</fieldType>

我将该字段定义为:

<field name="Categories" type="text_comma_delimited" indexed="true" stored="true" />

现在我想要按这些类别分组的产品,所以我使用这样的简单分组查询:

http://localhost:8089/solr/products/select?q=*:*&wt=json&indent=true&group=true&group.field=Categories&group.limit=-1&rows=-1&group.ngroups=true&group.facet=true

但是我得到的结果只返回了2组而不是6组。似乎它正在考虑产品和类别之间的一对一关系,因此一个产品只出现一次,因为它应该是一对多。一种产品可以出现在多个类别中。结果如下:

{
  "responseHeader":{
    "status":0,
    "QTime":2,
    "params":{
      "fl":"Category,SKU",
      "group.ngroups":"true",
      "indent":"true",
      "start":"0",
      "q":"*:*",
      "group.limit":"-1",
      "group.field":"Category",
      "group":"true",
      "wt":"json",
      "group.facet":"true",
      "rows":"-1"}},
  "grouped":{
    "Specialties":{
      "matches":6,
      "ngroups":2,
      "groups":[{
          "groupValue":"Fiction",
          "doclist":{"numFound":3,"start":0,"docs":[
              {
                "SKU":"F5678",
                "Category":"Fiction,ABC,XYZ"},
              {
                "SKU":"F9876",
                "Category":"Fiction,ABC,PQR"},
              {
                "SKU":"F2365",
                "Category":"PQR,Fiction"},
              ]},
        {
          "groupValue":"Technical",
          "doclist":{"numFound":1,"start":0,"docs":[
              {
                "SKU":"T9876",
                "Category":"CVB,Technical"}]
          }}]}}}

我尝试了分面,并使用此网址清楚地显示每个类别的正确计数:

http://localhost:8089/solr/products/select?q=*:*&wt=json&indent=true&facet=true&facet.field=Categories

结果给了我完美的列表和计数,但上面的分组响应只是没有数据:

"facet_counts":{
    "facet_queries":{},
    "facet_fields":{
      "Categories":[
        "Fiction",3,
        "Mystery",1,
        "Sci-Fi",1,
        "Self Help",1,
        "Technical",1,
        "Philosophy",1
        ]},
    "facet_dates":{},
    "facet_ranges":{}}}

此外,solr管理控制台的架构浏览器中的“加载术语信息”显示上述字段值和计数。只是组查询没有正确返回。 还有什么可以尝试的吗?任何帮助表示赞赏。

0 个答案:

没有答案