如果我可以在伪分布式或完全分布式模式下调试namenode和datanode的实际工作机制,我认为详细了解Hadoop是非常好的。
我认为apaceh hadoop团队或者...... hadoop,hdfs或mapreduce的任何主要开发者都可以做到这一点,但是没有文件提到这种方法。
每个文档都提到了如何在本地环境中使用eclipse调试mapreduce。这意味着LocalJopRunner正在运行,我们可以看到LocalJobRunner如何运行。
感谢。
答案 0 :(得分:0)
您可以在 Developing Hadoop Wiki 上找到相关详细信息。它有关于如何设置开发环境,如何开发单元测试等详细信息。
HTH
答案 1 :(得分:0)
调试hadoop守护进程而不是How to debug hadoop mapreduce jobs from eclipse?,然后可以将Java调试选项添加到/ etc / default / hadoop-daemon-name
E.g。调试名称节点将以下内容添加到 / etc / default / hadoop-hdfs-namenode
export HADOOP_OPTS="$HADOOP_OPTS -agentlib:jdwp=transport=dt_socket,server=y,suspend=n,address=8000"
然后,您可以从eclipse远程连接到端口8000上的namenode。 显然,删除它之后会打开您的名称节点,从世界上任何地方发布可能的滥用行为!