Solr - 按组聚合的术语频率

时间:2013-07-28 19:23:53

标签: solr lucene lucidworks

假设我在Solr(最新)中抓取并编入索引的以下分组网站集:

{
    "id":"1",
    "domain": "http://www.category1website1.com",
    "domainGroup": "Group 1"
},{
    "id":"2",
    "domain": "http://www.category1website2.com",
    "domainGroup": "Group 1"
},{
    "id":"3",
    "domain": "http://www.category2website1.com",
    "domainGroup": "Group 2"
}

我正在寻找一个结果集,它会在每个域中为我提供术语频率,但也会查找该搜索词的聚合术语频率(由domainGroup汇总)。

研究这一点让我有了三种可能性:

  1. Can be done with Facet Pivot
  2. Can be done with Facet + Term Frequency Vectors
  3. Cannot be done
  4. 1和2是不同的,我不确定哪个适合我,或者更糟,不是通过“选项”3。

    很抱歉,如果不清楚的话。我正在尝试检索“搜索词”的频率,但我还需要domainGroup字段聚合的频率。换句话说,我需要在一个请求中搜索所有域中的“搜索词”并检索“搜索词”的频率,而不是单个域(默认值),还要检索所有域组的聚合频率(所以同一域组下所有域中的术语频率。)

1 个答案:

答案 0 :(得分:0)

我认为Facets with Term frequency Vectors正是您所需要的。 尝试这样的查询:

http://something/solr/select/?qt=tvrh&q=query:http://www.category2website1.com&tv.fl=query&tv.all=true&f.id.tv.tf=true&facet.field=domainGroup&facet=true&facet.limit=-1&facet.mincount=1