我有一个由大量(比如十亿)向量[ x1, x2, x3 ]
组成的数据表,我想问一下典型的OLAP问题,例如“对于给定范围内x1的所有向量,是什么v3的平均值?“与真正的OLAP不同,问题不是 ad-hoc :我只有少数预先定义的问题。
在SQL数据库中,您可以说如果列未被索引,则空间要求为O(n),因此是时间;索引以O(n log n)为空间为您提供O(log n)时间。
那么,CouchDB大致相当于性能吗?好多了?更糟糕的是?
答案 0 :(得分:4)
如果您想要进行即席查询,CouchDB通常会更糟,如果您有预先烘焙的查询,则会更好。
这只是关于CouchDB的技术问题,而不是NOSQL与SQL。
CouchDB在即席查询方面稍慢,我认为需要进行表扫描。但是,当您逐步添加数据时,视图会逐渐更新,因此它可以用于维护“Sum”,“Count”或其他任何可以减少Map的内容。