在卡桑德拉奇怪的复制

时间:2016-08-09 14:31:33

标签: performance cassandra replication cassandra-2.0 cassandra-2.1

我在Cassandra的'Test Cluster'上配置了本地3个节点。当我运行它们并在所有三个节点上创建一些键空间或表时,键空间或表出现。

我正在处理的问题是,当我从CSV中导入数百万行时,我已经构建了整个数据突然出现在所有三个节点上。我在三个节点上复制了相同的数据。

正如我所熟悉的,我导入的数据应该通过节点复制/分发,但部分复制/分发。第一个节点上有一个分区,第二个节点上有第二个,第二个节点上有第三个,第一个节点上又有第四个...... 我是对的还是我错过了一些大事?

此外,对于多节点群集,我本地的写入速度大约为10k行/秒。这不是太低了吗?

我想创建讨论,以便我可以从您的经验中学到更多东西,看看我在哪里弄乱。

谢谢!

1 个答案:

答案 0 :(得分:0)

在群集中写入数据的节点数由该键空间的复制因子决定。如果您有3个节点且数据正在写入所有节点,则此设置必须设置为3.如果您只希望将数据复制到两个节点,则必须将此值设置为2。 / p>

您的写入速度将受到您在写入时指定的一致性级别的影响。如果将它设置为ALL,则必须等到所有要写入数据的节点都写入数据(在您的情况下,所有3个节点都基于您的复制因子)。在写入时删除一致性级别可能会使写入时间更快。您可以进一步研究复制因子,写入一致性级别和读取一致性级别之间的平衡。