如何获取DRUID中可用的最新数据的时间戳

时间:2019-07-17 08:04:28

标签: druid

我看到要获取针对特定数据源的索引到Druid的数据的最新时间戳,有两种选择:

  1. 对协调器的API调用
  

/ druid / coordinator / v1 / metadata / datasources / {dataSourceName}

此处Coordinator API

  1. 对Broker的API调用
  

{       “ queryType”:“ timeBoundary”,       “ dataSource”:“ sample_datasource”,       “ bound”:<“ maxTime” | “ minTime”>#可选,如果未设置,则默认返回两个时间戳       “ filter”:{“ type”:“ and”,“ fields”:[,,...]}#可选}

如此处所述

https://druid.apache.org/docs/latest/querying/timeboundaryquery.html

这两个返回结果均具有变量 maxTime

但是我看到返回的值是不同的:

enter image description here

对于上述示例(按1小时细分批量摄取),

我看到协调器API返回“ maxTime”:“ 2019-07-17T00:00:00.000Z” 而Broker API返回“ maxTime”:“ 2019-07-16T23:00:00.000Z”

因此,协调器API返回最新段的终结点,而代理API返回起始段,对吗?

但是使用相同的名称 maxTime 来表示2种不同的东西是否会引起混淆?

此外, maxTime 是如何为实时摄取计算的?

我看到即使是实时摄取,区别也一样:协调器返回最新细分的端点,而代理返回起点。但是由于是实时摄取,可能会出现延迟值,因此如何计算maxTime?

0 个答案:

没有答案