是否有监控正在运行的Hive进程并确保它们确实并行工作?
我已经设置了一个实验性的Linux集群(4台机器),并希望了解基础流程。
top和ps不会给我太多信息。
答案 0 :(得分:1)
Hive查询分为几个MR,分别称为sql_text-stage 1,sql_text-stage-2等。
您可以在
上输入群集的JobTracker Web UI的UI
job_tracker_adress:50030
在那里,您将看到蜂巢工作及其进展。
对于每个作业,将有任务列表,您可以看到每个任务在哪个节点上运行,以及它们的基本统计信息