在Cassandra中为具有不同数据的多个数据中心进行数据分区

时间:2014-09-09 13:54:23

标签: cassandra

到目前为止,我已经通过Cassandra中的数据分区找到了一些基本的处理方式,比如你有6个节点,每个节点有两个独立的数据中心,我们有以下数据复制方法:

通过解析节点直到Cassandra遇到属于另一个数据中心的环中的节点并将副本放在那里进行数据复制,重复该过程,直到所有数据中心都有一个节点副本 - 根据NetworkTopologyStrategy。

所以,我们有两个整个数据副本,每个数据中心有一个副本。但是,如果我想根据业务或地理位置等属性在逻辑上将数据拆分为两个单独的块,那该怎么办。(印度数据中心的数据显示)。因此,我们在一个地理位置的数据中心有一大块数据,另一个位置有另一个块,而且没有一个重叠。

这可能吗? 考虑到Cassandra和大数据的应用,这是否有意义?

1 个答案:

答案 0 :(得分:1)

地理分片肯定是可能的。您只需运行多个未连接的数据中心,然后就不会复制。或者,您可以复制它们,但您的基于印度的应用程序只能读取和写入您的印度DC。它是否有意义取决于您的应用程序。