我在具有SUSE Linux Enterprise Server 11的VMware上以伪分布式模式安装Hadoop。我能够运行像word count这样的hello world示例。我还使用WinSCP连接到该VM并将几个XML文件上传到hadoop集群。
现在我的问题是如何配置我在我的本地机器上运行的eclipse,它是连接该VM并编写一些java代码来处理我在集群中转储的数据。我做了一些工作,能够在eclipse中获得Map / Reduce视角,但无法弄清楚如何从我的本地机器上连接VM上的hadoop,编写我的java代码(mapper,reducer类)来播放数据并保存结果回到集群中。
如果有人可以帮助我,这将是伟大的。提前谢谢。
如果需要更多信息,请与我们联系。
我正在使用hadoop-0.20.2-cdh3u5和eclipse europa 3.3.1
答案 0 :(得分:0)
此刻我也在努力解决这个问题。也许你会发现这些链接很有帮助:
干杯