我有一个简单的spark应用程序,它正在读取csv数据然后写入avro。这个应用程序工作正常,同时提交为spark-submit命令行但在尝试执行oozie spark动作时失败并出现以下错误。 错误讯息:
Failing Oozie Launcher, Main class [org.apache.oozie.action.hadoop.SparkMain], main() threw exception, net.jpountz.lz4.LZ4BlockInputStream.<init>(Ljava/io/InputStream;Z)V
java.lang.NoSuchMethodError: net.jpountz.lz4.LZ4BlockInputStream.<init>(Ljava/io/InputStream;Z)V
at org.apache.spark.io.LZ4CompressionCodec.compressedInputStream(CompressionCodec.scala:122)
at org.apache.spark.sql.execution.SparkPlan.org$apache$spark$sql$execution$SparkPlan$$decodeUnsafeRows(SparkPlan.scala:274)
at org.apache.spark.sql.execution.SparkPlan$$anonfun$executeTake$1.apply(SparkPlan.scala:366)
at org.apache.spark.sql.execution.SparkPlan$$anonfun$executeTake$1.apply(SparkPlan.scala:366)
at scala.collection.TraversableLike$$anonfun$flatMap$1.apply(TraversableLike.scala:241)
at scala.collection.TraversableLike$$anonfun$flatMap$1.apply(TraversableLike.scala:241)
at scala.collection.IndexedSeqOptimized$class.foreach(IndexedSeqOptimized.scala:33)
at scala.collection.mutable.ArrayOps$ofRef.foreach(ArrayOps.scala:186)
Oozie详情:
job.properties
nameNode=NAMEMODE:8020
jobTracker=JT:8032
queueName=default
oozie.use.system.libpath=true
oozie.wf.application.path=${nameNode}/user/oozie/spark/
workflow.xml
<workflow-app name="sample-wf" xmlns="uri:oozie:workflow:0.1">
<start to="sparkAction" />
<action name="sparkAction">
<spark xmlns="uri:oozie:spark-action:0.1">
<job-tracker>${jobTracker}</job-tracker>
<name-node>${nameNode}</name-node>
<configuration>
<property>
<name>oozie.launcher.mapreduce.map.memory.mb</name>
<value>1024</value>
</property>
<property>
<name>oozie.launcher.mapreduce.map.java.opts</name>
<value>-Xmx777m</value>
</property>
<property>
<name>oozie.launcher.yarn.app.mapreduce.am.resource.mb</name>
<value>2048</value>
</property>
<property>
<name>oozie.launcher.mapreduce.map.java.opts</name>
<value>-Xmx1111m</value>
</property>
</configuration>
<master>yarn</master>
<mode>client</mode>
<name>tssETL</name>
<class>com.sc.eni.main.tssStart</class>
<jar>${nameNode}/user/oozie/spark/tss-assembly-1.0.jar</jar>
<spark-opts>--driver-memory 512m --executor-memory 512m --num-executors 1 </spark-opts>
</spark>
<ok to="end"/>
<error to="fail"/>
</action>
<kill name="fail">
<message>Workflow failed, error
message[${wf:errorMessage(wf:lastErrorNode())}] </message>
</kill>
<end name="end" />
</workflow-app>
在作业跟踪器中,MAP Reduce工作即将成为其调用Spark Action并在那里失败但整体Oozie失败。
使用Veriosn
EMR Cluster: emr-5.13.0
Spark : 2.3
Scala 2.11
我还检查了hdfs:/ user / oozie / share / lib / lib_20180517102659 / spark中的oozie共享库,它包含lz4-1.3.0.jar,其中包含错误提及的类net.jpountz.lz4.LZ4BlockInputStream。
任何帮助都会非常感激,因为我在这方面花了很长时间。
非常感谢
答案 0 :(得分:0)
Oozie给出了
java.lang.NoSuchMethodError
当一个库通过多种方式可用时,就会产生冲突。由于您已指定
oozie.use.system.libpath =真
因此所有Oozie spark共享库都可用,并且build build.sbt中提到的所有jar也可用。
要解决此问题,请检查您在build.sbt中提到的哪些依赖关系也存在于oozie spark shared libraries文件夹中,然后在这些依赖项中添加“%provided”,这将从程序集jar中删除它们因此将不会罐子冲突。