如何从德鲁伊数据源中读取所有数据

时间:2017-02-21 16:04:44

标签: hadoop datasource druid

我在json下面使用读取德鲁伊数据源的所有数据。     但在请求阈值字段/值是必需的。     它返回阈值中指定的行数。

{
  "queryType" : "select",
  "dataSource" : "wikiticker",
  "granularity" : "day",
  "intervals" : [ "1000/3000" ],
  "filter" :null,
  "dimensions" : [ ],
  "metrics" : [ ],
  "descending" : "false",
  "pagingSpec" : {
    "threshold" : 10000,
    "pagingIdentifiers" : null
  },
  "aggregations" : [ ]
}

有没有办法通过将阈值设置为某个值来检索所有数据,该值返回数据源中的所有数据。

For eg:if intervals column is set to [ "1000/3000" ] gets data from all intervals.

1 个答案:

答案 0 :(得分:1)

系统的分布式特性使得每个时间间隔难以精确计算行数,因此答案是否定的。另请注意,select查询将实现内存中的所有行,因此您可能希望避免一次性提取所有数据并使用分页规范。