应用错误收集

当MapReduce作业运行要查找的内容时？

时间：2015-05-29 22:37:28

标签： hadoop mapreduce hive cluster-computing health-monitoring

我开始使用Hadoop - 我想知道

what all the factors that needs to be looked at when a Map Reduce job(say via Hive or Snapplex) is being triggered to ensure that the cluster is stable and that job does not do any major impact到群集

在哪里可以查找所有这些检查点，是否有任何标准阈值可以跟踪？

基本上是系统运行状况检查，以确保我们构建的MR作业是干净的

欣赏任何见解

1 个答案:

答案 0 :(得分：0)

Hadoop通常包含一个NameNode和JobTracker Web界面，用于监控目的。

NameNode UI为您提供可用节点和整体群集容量以及死节点的概述。

JobTracker UI概述了正在运行和失败的作业及其日志输出。

对NameNode的默认访问是通过http://localhost:50070/。对于Jobtracker：http://localhost:8088 （这可能会因您使用的hadoop分布而异）

在哪里寻找贡献者？
Mapreduce作业运行，并且有一个例外
MapReduce作业用于求和数字
按作业名称或ID查找hadoop mapreduce作业的作业状态
何时为每个映射器输出运行精确的组合器
当MapReduce作业运行要查找的内容时？
哪个在MapReduce作业中首先运行，组合器或分区程序
当NameNode关闭时，hadoop作业会发生什么？
MapReduce 2作业在本地运行，而不是提交给纱线
Hadoop MapReduce运行组合器时的确切来源

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？