应用错误收集

所以我对hadoop还有点新意，目前正在为Amazonaws建立一个小型测试集群。因此，我的问题涉及有关群集结构的一些提示，因此可以从远程计算机上提交作业。

目前我有5台机器。 4基本上是带有NameNodes，Yarn等的Hadoop集群。一台机器用作管理器机器（Cloudera Manager）。我将在设置中描述我的思考过程，如果有人能说出我不清楚的观点，那就太棒了。

我在想什么是小型集群的最佳设置。所以我决定只暴露一台经理机器，并可能使用它来通过它提交所有工作。其他机器将看到彼此等，但不能从外部世界访问。我对如何做到这一点有概念性的想法，但我不知道如何正确地做到这一点，如果有人能指出我正确的方向，那将是伟大的。

另一个重点是，我希望能够通过客户端计算机（可能是Windows）中的暴露计算机向集群提交作业。我对这个设置也不太清楚。我是否需要在机器上安装Hadoop才能使用正常的hadoop命令，并从Eclipse或类似的东西中编写/提交作业。

总而言之，我的问题是，

谢谢，我非常感谢您的任何建议或帮助。

1。 REST API提交申请：