我存储了一系列包含section_url
和count
字段的记录。
我尝试按section_url
汇总并汇总count
字段,因此我要查询以下参数:
"params":{
"indent":"true",
"stats.field":"count",
"stats":"true",
"q":"section_url:tv AND domain:[* TO *] AND date:\"2014-12-22T00:00:00Z\"",
"stats.facet":"section_url",
"wt":"json"}}
正如您所看到的,我在计数字段上运行统计数据,并在section_url上运行统计数据。
大部分时间这种方法都运行良好,但出于某种原因,它在某些领域存在问题。例如,此结果My result
如您所见,所有section_url都是http://www.cb10.tv/
。但是,出于某种原因,我的统计数据似乎认为section_url实际上是两个字段,www.cb10
和tv
而不是http://www.cb10.tv/
知道可能出现什么问题?
答案 0 :(得分:1)
似乎section_url
被标记化,因为每个条目都有几个令牌。在索引标记上执行分面,这意味着您最终会对索引内容中的每个标记进行计数 - 而不是对字段本身的内容进行计数。
添加StrField
(或带有TextField
的{{1}})并执行KeywordTokenizer
填充(或更改现有字段),然后重新编制内容索引。请改用该字段来生成构面计数。