标签: optimization hadoop benchmarking cascading
我获得了一个多步级联程序,其运行时间大约是等效M / R作业运行时间的十倍。我如何确定哪个步骤运行速度最慢,以便我可以将其作为优化目标?
答案 0 :(得分:0)
不是一个完整的答案,但足以让你开始我想。您需要为您的工作生成MapReduce工作流的图形表示。请参阅此页面以获取示例:http://www.cascading.org/multitool/。该图应该有助于找出瓶颈所在。