我正在尝试使用spark-cassandra-connector方法 bulkSaveToCassandra 来优化我在Cassandra数据库中的插入。但是,我找不到方法,我不知道如何导入lib。
目前,我正在使用此依赖项:
<dependency>
<groupId>com.datastax.spark</groupId>
<artifactId>spark-cassandra-connector_2.11</artifactId>
<version>2.0.2</version>
</dependency>
以下是Datastax方法bulkSaveToCassandra的参考: http://docs.datastax.com/en/datastax_enterprise/4.7/datastax_enterprise/migration/migratingBulkSparkRDD.html
我使用链接中显示的导入,但无论如何它都无法正常工作。
致以最诚挚的问候,
答案 0 :(得分:1)
该方法仅适用于DataStax Enterprise。
所需的类位于DSE安装附带的dse-spark * .jar中。
例如,这可以从dse spark
shell获得。
对于大多数用例,我建议只使用普通的写入方法,因为bulkMethod使用sstable编写器,该编写器具有与生产用例无关的可用性问题。