Cassandra中具有大量节点的集群

时间:2016-04-24 08:45:20

标签: cassandra server hardware

架构:

我有两个DC:

DC1有3台服务器,每台服务器有1 Tera作为存储。 我们有NetworkToplogyStrategy和GossipingPropertyFileSnitch

让我知道我有一个1T的传入数据(在一段时间内,而不是一次全部),复制为3.这就是假设从DC1的3个服务器中填满我的存储空间。

我的问题:

是否可以(推荐或不推荐)在另一台DC2(复制系数为3)中部署6台具有0.5T的存储空间的机器以维持1T流量? (我可能在DC2中有更多的本地连接)

注意:我问你这个问题,因为将来在不同的数据中心可能会有不同的基础设施和硬件功能,因此我需要知道在我的问题中DC1和DC2是否可以使用该硬件模式。

提前谢谢。

2 个答案:

答案 0 :(得分:0)

好像你的问题真的是#34;我可以拥有不同拓扑结构的数据中心吗?",答案是肯定的 - 你可以很容易地得到一个RF = N = 3的DC,一秒钟具有一半大小且RF = 3,N = 6的节点的DC,以及另一个具有微小节点且RF = 3,N = 12的数据中心。

答案 1 :(得分:0)

  

是否可以(推荐或不推荐)在另一台DC2(复制因子为3)中部署6台具有0.5T的存储空间的计算机,以便能够维持1T流量?

理论上是的,这是可能的。

现在在实践中,根据数据的实际平衡方式,有时您不会在每个节点上完美地分配1/6的数据,因此您可能会遇到磁盘空间问题。如果虚拟节点非常正确,虽然它在Cassandra 3.x中更好,因为令牌分配算法已得到改进。

此外,如果您正在使用SizeTieredCompactionStrategy,则应保留一些磁盘可用空间以进行压缩。