多个火花上下文错误

时间:2016-07-01 17:44:46

标签: scala hadoop apache-spark

我在下面有这个火花代码:

    import org.apache.hadoop.hbase.client._
    import org.apache.hadoop.hbase.{ HBaseConfiguration, HTableDescriptor }
    import org.apache.hadoop.hbase.mapreduce.TableInputFormat
    import org.apache.hadoop.hbase.io.ImmutableBytesWritable
    import org.apache.hadoop.hbase.util.Bytes

    import kafka.serializer.StringDecoder

    import org.apache.spark._
    import org.apache.spark.SparkContext._
    import org.apache.spark.streaming._
    import org.apache.spark.streaming.kafka._

object Hbase {
    def main(args: Array[String]) {
          val sparkConf = new SparkConf().setAppName("Spark-Hbase").setMaster("local[2]")
          val sc = new SparkContext(sparkConf)

          ...

          val ssc = new StreamingContext(sparkConf, Seconds(3))
          val kafkaBrokers = Map("metadata.broker.list" -> "localhost:9092")
          val topics = List("test").toSet
          val lines = KafkaUtils.createDirectStream[String, String, StringDecoder, StringDecoder](ssc, kafkaBrokers, topics)
    }
}

现在我得到的错误是:

Only one SparkContext may be running in this JVM (see SPARK-2243). To ignore this error, set spark.driver.allowMultipleContexts = true.

上面的代码有什么问题吗?我没有看到我再次创建上下文...

2 个答案:

答案 0 :(得分:5)

这是您正在创建的两个SparkContext。这是不允许的。

val sc = new SparkContext(sparkConf)
val ssc = new StreamingContext(sparkConf, Seconds(3))

您应该从原始上下文创建流式上下文。

val ssc = new StreamingContext(sc, Seconds(3))

答案 1 :(得分:1)

您正在同一个JVM中初始化两个spark上下文,即(sparkContext和streamingContext)。这就是你得到这个例外的原因。你可以在config中设置spark.driver.allowMultipleContexts = true。虽然不鼓励使用多个Spark上下文。你可以得到意想不到的结果。