方解石 - 德鲁伊适配器中的超唯一聚合

时间:2017-02-28 03:59:35

标签: druid apache-calcite

在我的德鲁伊数据源中,我在其中一个字段上有一个hyperUnique聚合(摄取时间)。

我正在尝试在此聚合字段上执行等效的COUNT(DISTINCT(<hyperunique_field>))

方解石德鲁伊适配器是否支持?如果是这样,那么正确的方法是什么?

在胶合板中,我可以做COUNT_DISTINCT。运行它会返回0个计数。

SQL:

  

选择楼层(&#34; __时间&#34;到HOUR)time_bucket,“field_1&#34;,count(distinct(”ingestion_time_aggregated_field&#34;))为“datasource&#34;其中&#34; __时间&#34;在2017-01-01 00:00:00&#39;之间和&#39; 2017-01-02 00:00:00&#39;和“field_1&#34; in('value_1&#39;)和“field_2”=&#39; value_2&#39;和“field_3”=&#39; value_3&#39;和“field_4”=&#39; value_4&#39;逐层(&#34; __时间&#34;到HOUR),“field_1&#34;按楼层排序(&#34; __时间&#34;到HOUR);

ingestion_time_aggregated_field

{"name": "ingestion_time_aggregated_field", "type": "hyperUnique","fieldName": “field” }

1 个答案:

答案 0 :(得分:0)

方解石 - 德鲁伊适应不支持复杂的聚合器。原因是HLL是近似的而不是精确的,所以它实际上并不回答唯一计数的查询。