我有一项任务要调查使用带有hadoop的cassandra。
Hadoop的namenode是单点故障。这意味着如果namenode出现故障,则无法访问整个数据库。所有Cassandra节点都是相同的,因此没有单点故障。
如果我将Cassandra与Hadoop一起使用,我假设所有系统都有单点故障(据我所知,这是Hadoop名称节点)。
我的问题:
1-我之前的假设是真的吗?
2-如果是这种情况,使用这种结构有什么好处(Cassandra和Haddop)?
答案 0 :(得分:4)
它的半真半假。如果您将Cassandra与Hadoop一起使用,则所有数据都存储在Cassandra中而不是HDFS中,并且Hadoop正用于计算。因此,如果您的名称节点发生故障,您丢失的唯一一个就是能够运行map reduce任务,但您的所有数据都是安全且可访问的。