stats.field和stats.facet似乎没有正常工作

时间:2014-12-23 15:30:30

标签: solr solr4

我存储了一系列包含section_urlcount字段的记录。 我尝试按section_url汇总并汇总count字段,因此我要查询以下参数:

"params":{
  "indent":"true",
  "stats.field":"count",
  "stats":"true",
  "q":"section_url:tv AND domain:[* TO *] AND date:\"2014-12-22T00:00:00Z\"",
  "stats.facet":"section_url",
  "wt":"json"}}

正如您所看到的,我在计数字段上运行统计数据,并在section_url上运行统计数据。
大部分时间这种方法都运行良好,但出于某种原因,它在某些领域存在问题。例如,此结果My result
如您所见,所有section_url都是http://www.cb10.tv/。但是,出于某种原因,我的统计数据似乎认为section_url实际上是两个字段,www.cb10tv而不是http://www.cb10.tv/

知道可能出现什么问题?

1 个答案:

答案 0 :(得分:1)

似乎section_url被标记化,因为每个条目都有几个令牌。在索引标记上执行分面,这意味着您最终会对索引内容中的每个标记进行计数 - 而不是对字段本身的内容进行计数。

添加StrField(或带有TextField的{​​{1}})并执行KeywordTokenizer填充(或更改现有字段),然后重新编制内容索引。请改用该字段来生成构面计数。