我需要为实时引擎实现一个分布式存储系统。存储系统的一些基本要求是:
1)将数据分区到不同的分区
2)每个分区都有副本,以实现容错和数据持久性
3)动态缩放节点
对于许多大数据项目来说,这似乎是一个共同的功能。所以我想知道是否有任何开放源代码框架可以使此过程变得更容易?我做了一些挖掘,但发现没有任何用处。任何建议表示赞赏。
答案 0 :(得分:0)
也许这很明显,但是HDFS是大多数大数据项目在幕后使用的东西,并且作为Hadoop的一部分,它是开源的。
http://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-hdfs/HdfsDesign.html