在Amazon EMR上创建执行时间表

时间:2015-12-13 18:24:01

标签: hadoop emr

我有兴趣使用job_history_summary.py脚本创建我的EMR集群的任务时间轴,类似于此(picture from Smith College Hadoop Tutorial 1.1,但显然来自雅虎TeraSort实验报告。)。

enter image description here

似乎Hadoop日志存储在每个节点上,而不是存储在中央服务器上。我是否需要手动组合日志?似乎脚本实际上并没有产生图形。

1 个答案:

答案 0 :(得分:1)

您可以启用日志记录并提供s3存储桶。日志将被压缩并存储在提供的s3存储桶中。

AWS EMR enable logging screenshot