我正在尝试使用pyspark-cassandra connector
从cassandra表中读取数据。
我从pyspark-cassandra
我的脚本如下:
from pyspark import SparkConf, SparkContext
from pyspark.sql import SQLContext
import pyspark_cassandra
from pyspark_cassandra import CassandraSparkContext,Row
conf=SparkConf().setMaster("local").setAppName("App1").set("spark.cassandra.co nnection.host","http://192.168.0.2")
sc = CassandraSparkContext(conf=conf)
rdd = sc.cassandraTable("keyspace1", "table1")
当我使用命令运行上面的脚本时:
$ bin/spark-submit --packages TargetHolding:pyspark-cassandra:0.3.5 pyscript.py
我收到以下错误:
py4j.protocol.Py4JJavaError:调用
时发生错误 o83.newInstance。 :java.lang.NoClassDefFoundError:不能 初始化类com.datastax.spark.connector.types.TypeConverter $