我相信我了解HADOOP如何知道某个节点已崩溃。如果群集管理器在预定的时间内未收到任何一个从属设备发出的心跳,则表明它已死。
集群管理器如何确定节点是否慢?一旦确定该节点运行缓慢,它将如何处理该节点上的任务?
谢谢。
答案 0 :(得分:0)
回答我自己的问题。我正在使用汤姆·怀特(Tom White)的以下引用“ Hadoop: The Definitive Guide”。
哈罗德是正确的。根据这本书,由应用程序启动的任务会定期向应用程序母版报告状态。如果应用程序主管发现某个任务未报告进度,则认为该任务已挂起并自动终止相应的JVM。默认超时时间为10分钟。
构成进步的是书中也包含了单独的讨论。