由于大数据,Amazon Neptune或任何图形数据库中的组计数查询会失败吗?
我的意思是,如果计数超过count数据类型的限制,那么可能会出现n个溢出?
答案 0 :(得分:1)
简短答案
克里姆林宫查询语言语义(由Tinkerpop代码定义)将count()函数的输出定义为64位长。因此,是的,计数不能超过long的范围。
好答案
话虽如此,让我们尝试计算需要插入数据库才能达到该阈值的数据量。数据库中的每个实体(顶点/边缘/属性)都包含一个与其关联的唯一ID。假设我们假设每个实体的存储仅由标识符组成。另外,让我们假设标识符的数据类型是最有效的,即长(而不是使用比长使用更大空间的字符串)。
要达到计数极限,DB将需要存储至少2 ^ 64个实体,每个实体具有唯一的标识符,即至少((2 ^ 64)* 64)位数据,即大于1000 PetaBytes的数据非常保守的估计。
重点是,在达到计数上限之前,您需要存储大量数据。如果您要处理如此大量的数据,那么数据库可能不适合您。