如果数据之间的关系与数据一样重要 本身(如距离或路径计算),然后不要使用 列族/大表数据库。
(引自Andrew Oliver的文章Big data woes: Which database should I use?)
有人可以详细说明安德鲁的意思吗?这对我来说并不完全明显。
答案 0 :(得分:1)
大数据通常意味着数据库分布在多个服务器上。当您需要在不同服务器上相互连接条目时,基于表的数据库通常会出现严重的扩展问题。这使得它们不适合专注于数据库条目之间连接的用例。他们的查询语言通常也没有很好的分析连接。
在这种情况下,您应该考虑使用像Neo4j这样的图形数据库。图数据库的优缺点将在下面引用的文章中进一步描述。
图形数据库的常见用途包括地理空间问题, 推荐引擎,网络/云分析和生物信息学 - 基本上,数据之间关系的任何地方都是如此 重要的是数据本身。
图形数据库可以轻松跟踪数据库条目之间的关系。它们可以轻松查询用户朋友的朋友或所有具有共同兴趣的用户。