应用错误收集

HADOOP_HOME和hadoop流媒体

时间：2012-10-02 05:24:50

标签： hadoop hadoop-streaming

您好我正在尝试在安装了hadoop的服务器上运行hadoop，但我不知道hadoop所在的目录。服务器由服务器管理员配置。

为了加载hadoop，我使用dotkit包中的use命令。

可能有几个解决方案，但想知道hadoop软件包的安装位置，如何设置$ HADOOP_HOME变量，以及如何approp运行hadoop流式传输作业，例如$ HADOOP_HOME / bin / hadoop jar $ HADOOP_HOME / mapred / contrib / streaming / hadoop-streaming.jar，aka，http://wiki.apache.org/hadoop/HadoopStreaming。

谢谢！任何帮助将不胜感激！

3 个答案:

答案 0 :(得分：9)

如果你正在使用cloudera发行版，那么它最有可能在/usr/lib/hadoop，否则它可能在任何地方（由你的系统管理员决定）。

您可以使用一些技巧来尝试找到它：

locate hadoop-env.sh（假设已安装了locate，最近已经更新了b）
如果您运行此计算机的计算机正在运行hadoop服务（例如数据节点，作业跟踪器，任务跟踪器，名称节点），那么您可以执行hadoop命令的进程列表和grep：{{1 }}
如果不满足以上两项要求，请在一些常见位置查找hadoop根目录，例如：ps axww | grep hadoop，/usr/lib，/usr/local
失败所有这一切，并假设您当前的用户拥有权限：/opt

答案 1 :(得分：0)

如果您使用rpm安装，那么很可能是/etc/hadoop。

答案 2 :(得分：-4)

你为什么不试试：

echo $HADOOP_HOME

很明显，在你甚至可以从盒子的任何地方发出hadoop可执行文件之前，必须先设置上面的env变量。