在边缘节点中运行hadoop jar命令

时间:2017-09-17 02:57:13

标签: hadoop jar yarn hortonworks-data-platform

我是hadoop的新手,并且对于从edgeNode(http://www.dummies.com/programming/big-data/hadoop/edge-nodes-in-hadoop-clusters/)运行hadoop jar命令有疑问。hadoop jar ${JAR_FILE} {CLASS_NAMEWithPackage}。有以下问题

  1. 运行上面的命令后,为什么要提取jar 在edgeNode中的Djava.io.tmpdir目录?每次我运行这个命令,我得到一个 像tempo中的hadoop-unjar7637059002474165348这样的目录 先生,已经提取了jar。这是预期的吗?我在想hadoop jar提交整个罐子到纱线,但我不明白为什么它 在临时文件夹中提取?
  2. 在边缘节点中提取jar后,程序是否可以预期 删除提取的jar目录。在这种情况下 hadoop-unjar7637059002474165348?
  3. 谢谢!

1 个答案:

答案 0 :(得分:1)

您可以查看at herethis question,了解运行hadoop jar命令时在边缘节点(客户端节点)中提取jar的原因。它是从客户端节点运行jar时支持'jar-within-jar'的想法。把罐子推到HDFS,纱线和所有这些都发生在那之后但是,在这些发生之前,你的罐子必须先执行,对吧?在你的情况下,你可能有jar-within-jar或者你可能没有,但是这个概念是受支持的。

关于自动删除,可能不是自动删除。