DynamoDB如何查询重叠的时间范围

时间:2020-01-02 14:39:03

标签: amazon-dynamodb

考虑一个DynamoDB表,该表由一个主键和两个描述开始日期和结束日期的属性组成。如何在不扫描整个表的情况下查询时间范围是否与表中的时间范围重叠?

示例: 发电机表有两个记录

PK  Start        End
A   2019-01-01   2019-10-01
B   2019-06-01   2019-08-01

查询哪些记录与时间范围2018-02-01至2019-03-01重叠。

2 个答案:

答案 0 :(得分:2)

您肯定知道,DynamoDB 无法在一个查询中使用多个索引。
在大多数数据库中,您可以在“开始”和“结束”列上放置索引,数据库引擎将能够相当快速地确定匹配记录的交集。

代替此功能,我们需要一种方法将范围信息编码为单个可索引字段。

这样做的方法是利用“Z 顺序索引”。
Z-order 索引是一种编码多维信息的方式。

Z 顺序索引以及如何将其应用于 DynamoDB,在亚马逊博客文章 part onepart two 中有详细描述。

本质上,它的工作方式是将要查询的字段中的数据交错,您可以在二进制级别执行此操作,也可以在字符串级别执行此操作。
它可以应用于日期范围字符串的一种基本方法是将您的范围“20190101”到“20191001”交织到一个字段“2200119901100011”中

start     end       interleaved
20190101  20191001  2200119901100011
20190601  20190801  2200119900680011

然后要查询“20190502”和“20190905”之间的日期,使用两个日期之间的公共前缀,在结束范围内加一个(用二进制表示这个逻辑更简单)。

interleaved BETWEEN "22001199005" AND "2200119901" AND start >= "20190502" AND end < "20190905"

请注意,单独使用交错索引仍然是近似值,您仍然需要为开始和结束范围定义明确的条件。
但是,这种方法避免了扫描整个表。
当然,如果你查询一个很大的日期范围,无论如何它最终可能会查询整个表,范围越小,索引就越有效。

答案 1 :(得分:0)

老实说,我不确定DynamoDB是否适合此类用例