用于大型数据集的分布式复制二进制存储

时间:2011-12-20 13:49:06

标签: database nosql

对于一个非常狭窄的问题,我们需要一些现有的解决方案:一次写入多次读取时间序列存储。

我们关心的属性是:

  • 读取延迟低
  • 复制
  • 可扩展(能够像物理hw或金钱一样添加更多资源)

我们尝试了Google AppEngine数据存储区,数据块大约为~1亿个blob。不幸的是,阅读延迟和定价并不令人愉快。

我们要考虑的选项是:

  • Amazon SimpleDB
  • 我们自己托管的HDFS / HBase
  • 一些NoSQL品种(东京暴君?)
  • MySQL中的BLOB(必须手动分片)

我们错过了什么吗?我们应该考虑其他选择还是优先考虑其他选项?

2 个答案:

答案 0 :(得分:3)

尝试Lustre和/或Ceph。两者都有(或将有)商业支持。

答案 1 :(得分:2)

您可能还想查看Microsoft的Azure Storage服务。它们以合理的价格提供blob,表格(非关系)和队列。