我想编写一个Java包装器,它将'兼容程序'转换为map reduce表单,由Hadoop框架执行。 我知道我的问题很模糊。但这是我打算做的。
我被困在几点上。
欢迎任何建议。这将有助于我决定进一步的方向。
答案 0 :(得分:1)
一般来说,这是不可能的,并非所有程序都支持MapReduce范例。 MapReduce是一个框架,有些任务可以完成,有些则没有。你可以要求自己确定的最好的问题是alogrithm可以从map减少使用中受益。
答案 1 :(得分:1)
看看Hadoop Streaming。您可以使用任何可以读/写STDOUT / STDIN的语言编写map / reduce函数,然后将它们挂钩到Apache Hadoop。 Here是一个很好的教程,介绍如何使用兼容的Python map / reduce函数创建MapReduce作业。