实现Map Reduce的最佳编程方式

时间:2015-02-02 14:26:11

标签: hadoop mapreduce mincemeat

我们遇到了一个问题,这是应用MapReduce编程技术的理想情况。这个的初始代码是用Python编写的。现在我们有以下选择:

  1. 使用Hadoop和Java实现MapReduce部分。
  2. 使用mincemeat和Python实现MapReduce部分。
  3. 使用Hadoop和Python(Hadoop MapReduce Program in Python)来实现MapReduce部分。
  4. 我不太确定哪个是最好的选择。有人可以帮忙吗?

1 个答案:

答案 0 :(得分:2)

由于您的初始代码是在python中,并且无论是在python还是Java中编写MR都没有太大的区别,(3)应该是追求您的场景的最佳选择。您可能还想探索像https://github.com/Yelp/mrjob这样的库,这样可以更容易地在python中编写MR作业。