当完成的火花作业的查看日志在纱线上运行时,重定向到日志服务器以获取容器

时间:2017-08-10 01:26:39

标签: hadoop apache-spark yarn

我在纱线上运行火花。

我的spark versoin是2.1.1,而hadoop版本是apache hadoop 2.7.3。

当在群集模式下在yarn上运行spark作业时,我可以通过stdout / stderr链接查看Executor的日志,如

http://hadoop-slave1:8042/node/containerlogs/container_1500432603585_0148_01_000001/hadoop/stderr?start=-4096

但是当作业完成后,通过stdout / stderr链接查看Executor的日志会得到一个错误页面,如

  

重定向到容器_1500432603585_0148_01_000001的日志服务器

     

java.lang.Exception:未知容器。容器要么没有   已启动或已完成或不属于此节点   所有

然后它会自动重定向到

http://hadoop-slave1:8042/node/hadoop-master:19888/jobhistory/logs/hadoop-slave1:36207/container_1500432603585_0148_01_000001/container_1500432603585_0148_01_000001/hadoop

并获取其他错误页面,如

Sorry, got error 404  
Please consult RFC 2616 for meanings of the error code.  

Error Details

org.apache.hadoop.yarn.webapp.WebAppException: /hadoop-master:19888/jobhistory/logs/hadoop-slave1:50284/container_1500432603585_0145_01_000002/container_1500432603585_0145_01_000002/oryx: controller for hadoop-master:19888 not found
        at org.apache.hadoop.yarn.webapp.Router.resolveDefault(Router.java:232)
        at org.apache.hadoop.yarn.webapp.Router.resolve(Router.java:140)
        at org.apache.hadoop.yarn.webapp.Dispatcher.service(Dispatcher.java:134)
        at javax.servlet.http.HttpServlet.service(HttpServlet.java:820)
        at com.google.inject.servlet.ServletDefinition.doService(ServletDefinition.java:263)

实际上我可以在使用此URL时访问Executor的日志  火花工作完成:

http://hadoop-master:19888/jobhistory/logs/hadoop-slave1:36207/container_1500432603585_0148_01_000001/container_1500432603585_0148_01_000001/hadoop

它与之前的网址略有不同,它删除了头部" hadoop-slave1:8042 / node /"。

有没有人知道另一种更好的方法来在火花作业完成时查看火花日志?

我已经确认了yarn-site.xml

  <property>
      <name>yarn.resourcemanager.hostname</name>
      <value>hadoop-master</value>
      <description>The hostname of the RM.</description>
  </property>  

  <property>
      <name>yarn.log-aggregation-enable</name>
      <value>true</value>
  </property>

  <property>
      <name>yarn.log.server.url</name>
      <value>${yarn.resourcemanager.hostname}:19888/jobhistory/logs</value>
  </property>

和mapred-site.xml

<property>
    <name>mapreduce.jobhistory.address</name>
    <value>${yarn.resourcemanager.hostname}:10020</value>
  </property>

  <property>
    <name>mapreduce.jobhistory.admin.address </name>
    <value>${yarn.resourcemanager.hostname}:10033</value>
  </property>

  <property>
    <name>mapreduce.jobhistory.webapp.address</name>
    <value>${yarn.resourcemanager.hostname}:19888</value>
  </property>

1 个答案:

答案 0 :(得分:0)

我遇到过这种情况。通过YARN UI 历史记录标签查看已完成的火花蒸汽作业日志,但收到以下错误:

  

尝试将重定向URL构造到日志服务器时失败。可能未配置Log Server URL   java.lang.Exception:未知容器。容器要么尚未启动,要么已完成或根本不属于此节点。

解决方案是配置文件yarn-site.xml。添加密钥 yarn.log.server.url

<property>
<name>yarn.log.server.url</name>        
<value>http://<LOG_SERVER_HOSTNAME>:19888/jobhistory/logs</value>
</property>

然后重新启动yarn cluster 以重新加载yarn-site.xml。(这一步很重要!)