我正在研究apache紧缩。据我所知,crunch是一个基于map-reduce框架的抽象框架。我打算使用crunch而不是map-reduce框架。
我的问题是map-reduce可以做哪些工作但是可以做什么?
答案 0 :(得分:1)
我不认为mapreduce可以做什么,而apache crunch不能。 Apache crunch是一个在Mapreduce上运行的框架,就像Hive,Pig一样。事实上,它通过编写DoFn使地图简化编程变得简单,并且使用其执行计划程序和引擎来处理地图中的业务逻辑或减少阶段。与纯粹的地图缩减代码形式相比,像连接这样的概念很容易在紧缩中实现。