我们已经构建了具有6个节点的cassandra集群,每个节点具有64G RAM和16个核心。我们使用了Replication Factor of 3.
我们已经分配了8G的堆。
当我们从spark中摄取数据时,其中一个节点正在等待大量突变阶段,并且一些突变正在被丢弃。
1)机器与其他机器配置相同。 2)它没有任何其他工作正在运行。
据我所知,我们没有和热点。
我们根据访问模式加载到两个表。其中一个表有28列,另一个有9列。
28列的表格出现了问题。 我们已将concurrent.writes配置减少到2,因此不会将过多的负载推送到节点。即使这样也无法解决问题。
我们是否遗漏了任何东西。