如何使用带有spark-cassandra-connector的方法bulkSaveToCassandra

时间:2017-07-13 05:56:04

标签: apache-spark cassandra spark-cassandra-connector

我正在尝试使用spark-cassandra-connector方法 bulkSaveToCassandra 来优化我在Cassandra数据库中的插入。但是,我找不到方法,我不知道如何导入lib。

目前,我正在使用此依赖项:

<dependency>
            <groupId>com.datastax.spark</groupId>
            <artifactId>spark-cassandra-connector_2.11</artifactId>
            <version>2.0.2</version>
</dependency>

以下是Datastax方法bulkSaveToCassandra的参考: http://docs.datastax.com/en/datastax_enterprise/4.7/datastax_enterprise/migration/migratingBulkSparkRDD.html

我使用链接中显示的导入,但无论如何它都无法正常工作。

致以最诚挚的问候,

1 个答案:

答案 0 :(得分:1)

该方法仅适用于DataStax Enterprise。

所需的类位于DSE安装附带的dse-spark * .jar中。

例如,这可以从dse spark shell获得。

对于大多数用例,我建议只使用普通的写入方法,因为bulkMethod使用sstable编写器,该编写器具有与生产用例无关的可用性问题。