组计数查询是否可以由于大数据而失败? Amazon Neptune图数据库

时间:2018-07-28 15:56:00

标签: graph amazon-neptune

由于大数据,Amazon Neptune或任何图形数据库中的组计数查询会失败吗?

我的意思是,如果计数超过count数据类型的限制,那么可能会出现n个溢出?

1 个答案:

答案 0 :(得分:1)

简短答案

克里姆林宫查询语言语义(由Tinkerpop代码定义)将count()函数的输出定义为64位长。因此,是的,计数不能超过long的范围。

好答案

话虽如此,让我们尝试计算需要插入数据库才能达到该阈值的数据量。数据库中的每个实体(顶点/边缘/属性)都包含一个与其关联的唯一ID。假设我们假设每个实体的存储仅由标识符组成。另外,让我们假设标识符的数据类型是最有效的,即长(而不是使用比长使用更大空间的字符串)。

要达到计数极限,DB将需要存储至少2 ^ 64个实体,每个实体具有唯一的标识符,即至少((2 ^ 64)* 64)位数据,即大于1000 PetaBytes的数据非常保守的估计。

重点是,在达到计数上限之前,您需要存储大量数据。如果您要处理如此大量的数据,那么数据库可能不适合您。