适用于小型数学数据但速度快且具有聚合功能的最佳数据存储解决方

时间:2011-05-26 14:10:31

标签: database nosql cloud storage distributed-system

我正在为具有这些要求的项目寻找数据存储解决方案:

  1. 应用程序动态创建 商店里的包装/桌子。
  2. 一小段时间(两个 例如,周) 表/容器获得了巨大的数量 插入物并行。上次阅读 必须立即可用。
  3. 插入的数据非常少,4 到6个数字列。
  4. 小查询/过滤支持 必需,但没有连接或交叉 查询。
  5. 需要执行一些聚合 功能如“计数”,“总和”, “Max”,“Min”和“Avg”。
  6. 基本上,我需要类似Windows Azure表存储但具有聚合功能的东西。

    你会推荐什么?

6 个答案:

答案 0 :(得分:4)

RavenDB支持您提及的所有内容。它的扩展性非常好,并通过Map / Reduce查询和Linq查询支持聚合函数。它也可以在内存中运行。

答案 1 :(得分:3)

MongoDB也是一个不错的选择。它支持单节点安装的组(聚合)查询。如果您需要扩展,您可以创建分片群集并使用map / reduce来满足聚合需求 - 但是当comap到其他解决方案时,Mongo map / reduce性能不是最高级别。

如果你需要在map / reduce中获得很好的表现,你可以看一下Hadoop

答案 2 :(得分:1)

为什么不使用 SQL Azure ?它支持聚合功能并满足您的所有需求,请查看this table

答案 3 :(得分:0)

如果它不必是免费的,kdb +将是一个不错的选择。它是一个主要用于金融时间序列分析的系统。它支持您所要求的一切,速度非常快。有一个免费试用版,但要在生产中使用它是昂贵的。它完全可以使用类似sql的语法进行查询,并且可以使用名为q的专有语言完全编程,该语言位于apl系列中。

http://www.kx.com/

答案 4 :(得分:0)

对于问题体中列出的要求,市场上任何有能力的SQL服务器都会处理这个问题,但是你需要设置一些索引才能让事情变得非常快。

但是这就像是说,如果你想让你的车快速行驶,你必须把它放在D里并按下油门踏板,这就是那个fwiw。

答案 5 :(得分:0)

真的需要有关要求和预算的更多信息......但是,由于人们只是提出了一些答案,我会把这个放到混合中:

有一些非常酷且非常昂贵的硬件解决方案,用于运行大规模并行SQL查询,例如Netezza Skimmer或TwinFin

http://www.netezza.com/data-warehouse-appliance-products/skimmer.aspx

几乎让我希望我们的数据仓库太慢 - 只是这样我才能得到其中一只小狗。