在我的德鲁伊数据源中,我在其中一个字段上有一个hyperUnique聚合(摄取时间)。
我正在尝试在此聚合字段上执行等效的COUNT(DISTINCT(<hyperunique_field>))
。
方解石德鲁伊适配器是否支持?如果是这样,那么正确的方法是什么?
在胶合板中,我可以做COUNT_DISTINCT
。运行它会返回0个计数。
SQL:
选择楼层(&#34; __时间&#34;到HOUR)time_bucket,“field_1&#34;,count(distinct(”ingestion_time_aggregated_field&#34;))为“datasource&#34;其中&#34; __时间&#34;在2017-01-01 00:00:00&#39;之间和&#39; 2017-01-02 00:00:00&#39;和“field_1&#34; in('value_1&#39;)和“field_2”=&#39; value_2&#39;和“field_3”=&#39; value_3&#39;和“field_4”=&#39; value_4&#39;逐层(&#34; __时间&#34;到HOUR),“field_1&#34;按楼层排序(&#34; __时间&#34;到HOUR);
ingestion_time_aggregated_field :
{"name": "ingestion_time_aggregated_field", "type": "hyperUnique","fieldName": “field” }
答案 0 :(得分:0)
方解石 - 德鲁伊适应不支持复杂的聚合器。原因是HLL是近似的而不是精确的,所以它实际上并不回答唯一计数的查询。