标签: ruby hadoop mapreduce hadoop-streaming
我在Ruby中构建了一个映射器和一个reducer,它作为一个流工作成功运行。但是,我需要做第二张地图并根据最后一次减少的输出进行缩小。
有没有什么办法可以在流媒体作业中为mappers和reducer定义多个Ruby文件?喜欢链接。
答案 0 :(得分:0)
没有
你可以链接两个流作业,只需使用第一个作为第二个输入目录的输出目录。