HADOOP_HOME和hadoop流媒体

时间:2012-10-02 05:24:50

标签: hadoop hadoop-streaming

您好我正在尝试在安装了hadoop的服务器上运行hadoop,但我不知道hadoop所在的目录。服务器由服务器管理员配置。

为了加载hadoop,我使用dotkit包中的use命令。

可能有几个解决方案,但想知道hadoop软件包的安装位置,如何设置$ HADOOP_HOME变量,以及如何approp运行hadoop流式传输作业,例如$ HADOOP_HOME / bin / hadoop jar $ HADOOP_HOME / mapred / contrib / streaming / hadoop-streaming.jar,aka,http://wiki.apache.org/hadoop/HadoopStreaming

谢谢!任何帮助将不胜感激!

3 个答案:

答案 0 :(得分:9)

如果你正在使用cloudera发行版,那么它最有可能在/usr/lib/hadoop,否则它可能在任何地方(由你的系统管理员决定)。

您可以使用一些技巧来尝试找到它:

  1. locate hadoop-env.sh(假设已安装了locate,最近已经更新了b)
  2. 如果您运行此计算机的计算机正在运行hadoop服务(例如数据节点,作业跟踪器,任务跟踪器,名称节点),那么您可以执行hadoop命令的进程列表和grep:{{1 }}
  3. 如果不满足以上两项要求,请在一些常见位置查找hadoop根目录,例如:ps axww | grep hadoop/usr/lib/usr/local
  4. 失败所有这一切,并假设您当前的用户拥有权限:/opt

答案 1 :(得分:0)

如果您使用rpm安装,那么很可能是/etc/hadoop

答案 2 :(得分:-4)

你为什么不试试:

echo $HADOOP_HOME

很明显,在你甚至可以从盒子的任何地方发出hadoop可执行文件之前,必须先设置上面的env变量。

相关问题