限制Apache Solr Statscomponent计算和返回的值

时间:2012-10-10 13:26:32

标签: apache solr statistics

有没有办法将solr statscomponent http://bit.ly/T4PLnl配置为不包含“昂贵的”sumOfSquares和stddev?

我们只需要sum,min,max,mean,count和missing。

2 个答案:

答案 0 :(得分:0)

使用支持以下内容的AnalyticsComponent

  • StatsComponent(SOLR-4499
  • 的所有功能
  • Field Faceting(SOLR-3435
  • 支持限制
  • 排序(存储桶名称或存储桶中的任何统计信息)
  • 支持偏移
  • Range Faceting
  • 支持标准范围刻面的所有选项
  • 查询分面(SOLR-2925
  • 能够使用整体/字段构面统计作为范围/查询分面的输入(即最小/最大日期计算,然后在该范围内进行分面)
  • 支持更复杂的聚合/映射操作(SOLR-1622
  • 聚合:min,max,sum,平方和,计数,缺失,stddev,平均值,中位数,百分位数
  • 操作:否定,绝对,加,乘,除,幂,日志,数学,字符串反转,字符串连接

用法:

Turning it on
Parameter Default Description
olap=[true/false] Enable enhanced analytics functionality

<强>参考

答案 1 :(得分:0)

这是我尝试过的一次。我所关心的只是总和,计数和缺失,而且仍在进行分析表明,统计数据的计算成本非常低,而且是免费的。考虑sumOfSquares需要O(1)空间和O(n)时间,与sum,min,max,mean,count和missing相同。无论您是否计算sumOfSquares,StatsComponent仍然必须迭代结果集并获取每个doc的字段值。 ParseDouble绝对是非分面统计数据的热点,至少如果你使用的是字符串字段!