使用Java语言进行Spark cassandra连接应使用哪个版本?

时间:2019-02-15 09:35:28

标签: java spark-cassandra-connector

我正在尝试使用Java语言连接spark和cassandra数据库。为了连接spark和cassandra,我正在使用最新版本的Spark-cassandra-Connector,即2.4.0。目前,我可以使用连接器连接spark和cassandra。我正在以RDD格式获取数据,但无法从该数据结构读取数据。如果我将行读取器工厂用作cassandraTable()的第三个参数,我将得到

> Wrong 3rd argument type. Found:
> 'java.lang.Class<com.journaldev.sparkdemo.JohnnyDeppDetails>',
> required:
> 'com.datastax.spark.connector.rdd.reader.RowReaderFactory<T>'

任何人都可以告诉我应该使用哪个版本或这里有什么问题吗?

  

CassandraTableScanJavaRDD价格RDD2 =   CassandraJavaUtil.javaFunctions(sc).cassandraTable(keyspace,table,JohnnyDeppDetails.class);

我的pom.xml:

    <!-- Import Spark -->
    <dependency>
        <groupId>org.apache.spark</groupId>
        <artifactId>spark-core_2.11</artifactId>
        <version>2.4.0</version>
    </dependency>

    <dependency>
        <groupId>junit</groupId>
        <artifactId>junit</artifactId>
        <version>4.11</version>
        <scope>test</scope>
    </dependency>

    <!-- https://mvnrepository.com/artifact/com.datastax.spark/spark-cassandra-connector -->
    <dependency>
        <groupId>com.datastax.spark</groupId>
        <artifactId>spark-cassandra-connector_2.11</artifactId>
        <version>2.4.0</version>
    </dependency>

    <dependency>
        <groupId>com.datastax.spark</groupId>
        <artifactId>spark-cassandra-connector-java_2.10</artifactId>
        <version>1.5.0-M2</version>
    </dependency>

    <dependency>
        <groupId>com.datastax.cassandra</groupId>
        <artifactId>cassandra-driver-core</artifactId>
        <version>2.1.9</version>
    </dependency>

    <dependency>
        <groupId>com.datastax.cassandra</groupId>
        <artifactId>cassandra-driver-mapping</artifactId>
        <version>2.1.9</version>
    </dependency>

    <!-- https://mvnrepository.com/artifact/org.apache.spark/spark-sql -->
    <dependency>
        <groupId>org.apache.spark</groupId>
        <artifactId>spark-sql_2.12</artifactId>
        <version>2.4.0</version>
    </dependency>

</dependencies>

1 个答案:

答案 0 :(得分:0)

代替传递类实例,您需要使用RowReaderFactory函数创建mapRowTo,如下所示(这是from my example):

CassandraJavaRDD<UUIDData> uuids = javaFunctions(spark.sparkContext())
      .cassandraTable("test", "utest", mapRowTo(UUIDData.class));

回写时,可以通过mapToRow函数将类转换为相应的工厂。