hadoop群集澄清

时间:2012-11-30 21:17:05

标签: hadoop amazon-ec2

我是hadoop的新手,我正试图在Amazon EC2上运行一个hadoop jar。我已经通过控制台启动了我的amazon ec2实例,将我的文件上传到dfs,然后能够成功运行作业jar并在实例上生成输出。

但我仍然对一方感到困惑。我不确定这份工作是在亚马逊ec2上的一台机器上运行还是在集群上运行?如何找到jar运行所涉及的工作节点数?

在一些参考链接中,我看到我们必须使用launch-cluster命令,例如“bin / hadoop-ec2 launch-cluster test-cluster 2”。从控制台启动实例并使用此命令(如launch-cluster)有什么不同。

0 个答案:

没有答案