应用错误收集

时间：2011-03-21 10:19:11

标签： hadoop

假设我编写了一个java程序，我想在Hadoop中运行它，然后

答案 0 :(得分：1)

我能想到的最简单的答案是：

1）任何地方 2,3,4）$HADOOP_HOME/bin/hadoop jar [path_to_your_jar_file]

答案 1 :(得分：0)

它可能看起来很复杂，但它比你想象的要简单！

将您的map/reduce课程和main课程编入jar。我们称这个jar为myjob.jar。
- 此jar不需要包含Hadoop库，但它应该包含您拥有的任何其他依赖项。
- 您的主要方法应设置并运行您的地图/减少作业here is an example。
将此jar放在安装了hadoop命令行实用程序的任何计算机上。
使用hadoop命令行实用程序运行main方法：
- hadoop jar myjob.jar

希望有所帮助。

答案 2 :(得分：0)

数据应保存在＆＃34; hdfs＆＃34;中。您可能希望使用Apache Flume之类的东西从数据源将其加载到集群中。该文件可以放在任何地方，但大多数家庭是/ user / hadoop /

SSH进入hadoop集群头节点，就像标准的linux服务器一样。

列出你的hadoop root hdfs hadoop fs -ls /

您应该使用hadoop命令访问您的数据并运行您的程序，试试hadoop help

hadoop -jar MyJar.jar com.mycompany.MainDriver arg[0] arg[1] ...