我在https://groups.google.com/forum/#!topic/druid-user/SYWcqcr504k问我的问题 但没有人帮我解决这个问题。
我正在处理大型数据集。对于sam“queryGranularity”的2个案例(按天的segmentGranularity和按小时的segmentGranularity)的topN查询是“小时”。
案例01:白天
"granularitySpec" : {
"type" : "uniform",
"segmentGranularity" : "day",
"queryGranularity" : "hour",
"intervals" : ["2016-08-22/2016-08-23"]
}
案例02:按小时
"granularitySpec" : {
"type" : "uniform",
"segmentGranularity" : "hour",
"queryGranularity" : "hour",
"intervals" : ["2016-08-22/2016-08-23"]
}
但查询“segmentGranularity”的时间:“day”比“segmentGranularity”:“hour”慢。谁能解释一下这个案子呢?为什么按日分段比按小时分段?在商店数据段之间按天和按小时,我如何选择段类型?它怎么能影响我的查询? 非常感谢 !
答案 0 :(得分:1)
您可以考虑以下事项来确定细分粒度:
我还建议您查看查询节点发出的各种德鲁伊指标(即历史和实时),以便在查询速度较慢的情况下找出瓶颈。 有关各种指标,请参阅http://druid.io/docs/latest/operations/metrics.html