目前,我们有一个运行3个Spark节点的项目。我们想扩大Spark工作人员。但是,就CPU /内存使用而言,使每个火花节点在Cassandra节点之上运行是非常昂贵的。我的问题是,是否可以在没有Cassandra的情况下使用DataStax部署Spark工作者?
答案 0 :(得分:1)
您通常会在每个Cassandra节点上部署一个Spark-worker以支持数据局部性(如果可能,spark-worker将优先命中它的本地节点)。 但是,如果您真的想将spark服务与cassandra服务分离,您可以选择以下几种方法: