为什么使用Python从Cassandra读取数据会因ClassNotFoundException而失败:org.apache.cassandra.hadoop.cql3.CqlPagingInputFormat?

时间:2015-09-17 09:28:15

标签: python cassandra apache-spark

我已安装cassandra并在主机127.0.0.1

中运行

我关注this tutorial,使用cqlsh创建了keyspace democf userpage。请参阅教程,我运行:

$SPARK_HOME/bin/spark-submit cassandra_inputformat.py 127.0.0.1 demo userpage

但它出现了错误:

py4j.protocol.Py4JJavaError: An error occurred while calling z:org.apache.spark.api.python.PythonRDD.newAPIHadoopRDD.
: java.lang.ClassNotFoundException: org.apache.cassandra.hadoop.cql3.CqlPagingInputFormat

我对此感到沮丧,我有来自http://spark-packages.org/package/TargetHolding/pyspark-cassandra

的配置连接器pyspark到cassandra

并放

spark.executor.extraClassPath      $SPARK_HOME/lib/pyspark-cassandra-0.1.5.jar
文件spark-defaults.conf

中的

我错过了什么?请帮忙

THX

注意:

  • Spark版本1.4.1
  • Cassandra 2.1.9
  • pyspark-cassandra包装版本:0.1.5

0 个答案:

没有答案