在spark独立模式下运行Spark作业服务器时出现异常

时间:2015-11-30 20:19:44

标签: scala apache-spark docker spark-jobserver

我正在尝试Spark job server - 具体来说,docker container option.我能够在火花本地模式下运行WordCountExample应用。但是,当我尝试将应用程序指向远程Spark主机时,我遇到了异常。

以下是我用于运行WordCountExample应用的命令:

 1. sudo docker run -d -p 8090:8090 -e SPARK_MASTER=spark://10.501.502.503:7077 velvia/spark-jobserver:0.6.0
 2. sbt job-server-tests/package
 3. curl --data-binary @job-server-tests/target/scala-2.10/job-server-tests_2.10-0.6.2-SNAPSHOT.jar localhost:8090/jars/test
 4. curl -d "input.string = a b c a b see" 'localhost:8090/jobs?appName=test&classPath=spark.jobserver.WordCountExample'

以下是我在上面执行第4步时遇到的异常:

{
  "status": "ERROR",
  "result": {
    "message": "Futures timed out after [15 seconds]",
    "errorClass": "java.util.concurrent.TimeoutException",
    "stack": ["scala.concurrent.impl.Promise$DefaultPromise.ready(Promise.scala:219)", "scala.concurrent.impl.Promise$DefaultPromise.result(Promise.scala:223)", "scala.concurrent.Await$$anonfun$result$1.apply(package.scala:107)", "akka.dispatch.MonitorableThreadFactory$AkkaForkJoinWorkerThread$$anon$3.block(ThreadPoolBuilder.scala:169)", "scala.concurrent.forkjoin.ForkJoinPool.managedBlock(ForkJoinPool.java:3640)", "akka.dispatch.MonitorableThreadFactory$AkkaForkJoinWorkerThread.blockOn(ThreadPoolBuilder.scala:167)", "akka.dispatch.BatchingExecutor$Batch.blockOn(BatchingExecutor.scala:101)", "scala.concurrent.Await$.result(package.scala:107)", ...

我使用

启动了远程Spark群集(主人和工作人员)
cd $SPARK_HOME
./sbin/start-all.sh

远程群集使用Spark version 1.5.1(即预建二进制spark-1.5.1-bin-hadoop2.6

问题

  1. 有关如何调试此问题的任何建议?
  2. 我是否有任何记录可以找出根本原因?
  3. 提前致谢。

2 个答案:

答案 0 :(得分:0)

这可能是一个网络问题。应该可以从Spark集群中访问SJS服务器。

答案 1 :(得分:0)

我和spark 1.6.1有同样的问题。我将jobserver版本改为last(0.6.2.mesos-0.28.1.spark-1.6.1),它对我有用。