Spark Streaming - CheckPointing问题

时间:2015-08-05 12:36:06

标签: twitter apache-spark spark-streaming checkpoint

我使用Twitter的流媒体用户API和火花流媒体完成了Twitter流式传输。这在我的本地计算机上成功运行。但是当我在本地模式下在集群上运行此程序时。它刚刚第一次成功运行。稍后会给出以下异常。

"Exception in thread "main" org.apache.spark.SparkException: Found both spark.executor.extraClassPath and SPARK_CLASSPATH. Use only the former."

并且火花类路径已经未设置!! 每次我必须创建一个新的检查点目录才能使其成功运行。否则它会显示异常。

有人可以帮我解决这个问题吗? 谢谢:)

2 个答案:

答案 0 :(得分:0)

尝试使用

#!/bin/bash
HBASE_HOME=/opt/cloudera/parcels/CDH/lib/hbase
SPARK_CLASSPATH="$HBASE_HOME/conf/:$HBASE_HOME/hbase-client.jar:$HBASE_HOME/hbase-protocol.jar:$HBASE_HOME/lib/htrace-core.jar:$HBASE_HOME/lib/htrace-core-3.1.0-incubating.jar"
spark-submit --num-executors 2 --executor-cores 2 --executor-memory 10G  --conf spark.executor.extraClassPath=$SPARK_CLASSPATH your_spark_program.jar --class your_entry_class

最重要的是--conf spark.executor.extraClassPath=$SPARK_CLASSPATH

答案 1 :(得分:0)

遇到过类似的问题。 设置SPARK_CLASSPATH会导致问题,因为它已被删除。所以不要使用它。

export LIB_JARS=dependency/jcodings-1.0.8.jar,dependency.....etc
spark-submit --deploy-mode client --master local --class org.xyz.spark.driver.SomeClass  --num-executors 10 --jars ${LIB_JARS}