Spark如何通过不同于CQLSH读/写过程的spark-Cassandra连接器进行写/读过程

时间:2017-10-31 14:39:02

标签: apache-spark nosql datastax-enterprise spark-cassandra-connector cassandra-3.0

我是新手,试图理解,当通过Cassandra集群上的spark-Cassandra连接器使用它时,它是如何有利的。

  1. 如何通过spark-Cassandra连接器写入(示例savetocassandra)Cassandra(火花SQL查询,它是否还涉及协调器节点?
  2. 如何通过spark-Cassandra连接器(Spark SQL查询)读取Cassandra,它是否仍然涉及协调器节点?
  3. 在集群的高范围读取扫描期间,是什么让火花克服了Cassandra的负荷?
  4. 如何通过spark-Cassandra连接器在Cassandra集群上执行高范围扫描cql读取查询?
  5. 使用IN子句通过Cassandra集群上的spark-Cassandra连接器是有利的吗?

1 个答案:

答案 0 :(得分:0)

这是一个很好的解释。如果你想了解spark-cassandra-connector内部,我还推荐其他Russell讲座 Cassandra和Spark优化数据位置 - Russell Spitzer(DataStax) https://www.youtube.com/watch?v=ikCzILOpYvA