如何在向hadoop提交远程应用程序时设置jar路径?

时间:2013-11-08 14:23:08

标签: java hadoop yarn

我尝试在网站上运行第一个例子 http://hadoop.apache.org/docs/current2/hadoop-yarn/hadoop-yarn-site/WritingYarnApplications.html

以下是我的代码

    Path jarPath = new Path("target/HadoopStudy-0.0.1-SNAPSHOT.jar");
    FileSystem fs = FileSystem.get(conf);
    FileStatus jarStatus = fs.getFileStatus(jarPath);
    LocalResource amJarRsrc = Records.newRecord(LocalResource.class);

    amJarRsrc.setType(LocalResourceType.FILE);

    amJarRsrc.setVisibility(LocalResourceVisibility.APPLICATION);


    logger.debug(ConverterUtils.getYarnUrlFromPath(jarPath));
    amJarRsrc.setResource(ConverterUtils.getYarnUrlFromPath(jarPath));
    amJarRsrc.setTimestamp(jarStatus.getModificationTime());
    amJarRsrc.setSize(jarStatus.getLen());
    localResources.put(Common.LOCAL_JAR_PATH, amJarRsrc);
    amContainer.setLocalResources(localResources);

但我可以获得应用程序ID。并将应用程序提交给yarn,但应用程序将始终失败,我检查了master的nodemanger日志,我发现了这些错误

java.net.URISyntaxException: Relative path in absolute URI: ://target/HadoopStudy-0.0.1-SNAPSHOT.jar
    at java.net.URI.checkPath(URI.java:1804)
    at java.net.URI.<init>(URI.java:752)
    at org.apache.hadoop.yarn.util.ConverterUtils.getPathFromYarnURL(ConverterUtils.java:77)
    at org.apache.hadoop.yarn.server.nodemanager.containermanager.localizer.LocalResourceRequest.<init>(LocalResourceRequest.java:46)
    at org.apache.hadoop.yarn.server.nodemanager.containermanager.container.ContainerImpl$RequestResourcesTransition.transition(ContainerImpl.java:523)
    at org.apache.hadoop.yarn.server.nodemanager.containermanager.container.ContainerImpl$RequestResourcesTransition.transition(ContainerImpl.java:494)
    at org.apache.hadoop.yarn.state.StateMachineFactory$MultipleInternalArc.doTransition(StateMachineFactory.java:385)
    at org.apache.hadoop.yarn.state.StateMachineFactory.doTransition(StateMachineFactory.java:302)
    at org.apache.hadoop.yarn.state.StateMachineFactory.access$300(StateMachineFactory.java:46)
    at org.apache.hadoop.yarn.state.StateMachineFactory$InternalStateMachine.doTransition(StateMachineFactory.java:448)
    at org.apache.hadoop.yarn.server.nodemanager.containermanager.container.ContainerImpl.handle(ContainerImpl.java:850)
    at org.apache.hadoop.yarn.server.nodemanager.containermanager.container.ContainerImpl.handle(ContainerImpl.java:73)
    at org.apache.hadoop.yarn.server.nodemanager.containermanager.ContainerManagerImpl$ContainerEventDispatcher.handle(ContainerManagerImpl.java:681)
    at org.apache.hadoop.yarn.server.nodemanager.containermanager.ContainerManagerImpl$ContainerEventDispatcher.handle(ContainerManagerImpl.java:674)
    at org.apache.hadoop.yarn.event.AsyncDispatcher.dispatch(AsyncDispatcher.java:134)
    at org.apache.hadoop.yarn.event.AsyncDispatcher$1.run(AsyncDispatcher.java:81)
    at java.lang.Thread.run(Thread.java:722)

我在PC A上运行示例,但是我在PC B部署了hadoop,而jar则在PC A上。

经过调查,我无法解决。但我有一些问题 1)我需要将jar上传到hdfs吗?如果我需要,我知道该怎么做 2)我只是了解纱线的一些原理,如果我想提交申请,我需要将罐子上传到掌握?我可以将jar文件上传到master的本地文件系统吗?如果我可以,如何设置路径?

1 个答案:

答案 0 :(得分:2)

  1. 我是否需要将jar上传到hdfs?如果我需要,我知道该怎么做

  2. 我只是了解纱线的一些原理,如果我想提交申请,我需要将jar上传到掌握?我可以将jar文件上传到master的本地文件系统吗?如果我可以,如何设置路径?

    YARN NodeManagers使用FileSystem接口将“本地化”jar放到本地节点上。要实现这一点,您需要将所有资源预先上传到可通过FileSystem实现访问的中心位置,通常是HDFS。

    所以,如果您有一个路径“target / HadoopStudy-0.0.1-SNAPSHOT.jar”,首先将其上传到HDFS上的主目录,假设为hdfs:///user/song/HadoopStudy-0.0.1 -SNAPSHOT.jar“然后在local-resource中设置该路径。