我看到要获取针对特定数据源的索引到Druid的数据的最新时间戳,有两种选择:
/ druid / coordinator / v1 / metadata / datasources / {dataSourceName}
{ “ queryType”:“ timeBoundary”, “ dataSource”:“ sample_datasource”, “ bound”:<“ maxTime” | “ minTime”>#可选,如果未设置,则默认返回两个时间戳 “ filter”:{“ type”:“ and”,“ fields”:[,,...]}#可选}
如此处所述
https://druid.apache.org/docs/latest/querying/timeboundaryquery.html
这两个返回结果均具有变量 maxTime 。
但是我看到返回的值是不同的:
对于上述示例(按1小时细分批量摄取),
我看到协调器API返回“ maxTime”:“ 2019-07-17T00:00:00.000Z” 而Broker API返回“ maxTime”:“ 2019-07-16T23:00:00.000Z”
因此,协调器API返回最新段的终结点,而代理API返回起始段,对吗?
但是使用相同的名称 maxTime 来表示2种不同的东西是否会引起混淆?
此外, maxTime 是如何为实时摄取计算的?
我看到即使是实时摄取,区别也一样:协调器返回最新细分的端点,而代理返回起点。但是由于是实时摄取,可能会出现延迟值,因此如何计算maxTime?