标签: python hadoop
假设我使用python更容易,因为numpy库,
我可以用python编写我的整个MapReduce任务,没有任何java代码
主要是,我需要有很多MapReduce轮次。这与" Job Chaining有关吗?"
做这种事的权利是什么?
答案 0 :(得分:1)
您应该使用Apache Spark。它比简单的Hadoop MapReduce模型快得多。它支持Python,Scala和Java来编写应用程序。