我使用Twitter的流媒体用户API和火花流媒体完成了Twitter流式传输。这在我的本地计算机上成功运行。但是当我在本地模式下在集群上运行此程序时。它刚刚第一次成功运行。稍后会给出以下异常。
"Exception in thread "main" org.apache.spark.SparkException: Found both spark.executor.extraClassPath and SPARK_CLASSPATH. Use only the former."
并且火花类路径已经未设置!! 每次我必须创建一个新的检查点目录才能使其成功运行。否则它会显示异常。
有人可以帮我解决这个问题吗? 谢谢:)
答案 0 :(得分:0)
尝试使用
#!/bin/bash
HBASE_HOME=/opt/cloudera/parcels/CDH/lib/hbase
SPARK_CLASSPATH="$HBASE_HOME/conf/:$HBASE_HOME/hbase-client.jar:$HBASE_HOME/hbase-protocol.jar:$HBASE_HOME/lib/htrace-core.jar:$HBASE_HOME/lib/htrace-core-3.1.0-incubating.jar"
spark-submit --num-executors 2 --executor-cores 2 --executor-memory 10G --conf spark.executor.extraClassPath=$SPARK_CLASSPATH your_spark_program.jar --class your_entry_class
最重要的是--conf spark.executor.extraClassPath=$SPARK_CLASSPATH
答案 1 :(得分:0)
遇到过类似的问题。 设置SPARK_CLASSPATH会导致问题,因为它已被删除。所以不要使用它。
export LIB_JARS=dependency/jcodings-1.0.8.jar,dependency.....etc spark-submit --deploy-mode client --master local --class org.xyz.spark.driver.SomeClass --num-executors 10 --jars ${LIB_JARS}