我需要在hadoop中创建数据管道。我有数据导入,导出,脚本来清理数据设置,现在需要在管道中设置它。
我一直在使用Oozie进行数据导入和导出计划,但现在也需要集成R脚本来进行数据清理过程。
我看到falcon也用于此。
答案 0 :(得分:1)
2)我很想回答Hortonworks的nifi,因为post on linkedin它已经发展了很多,而且非常接近取代oozie。当我写这个答案时,oozie和nifi之间的区别就在于它们运行的地方:外部集群上的nifi和oo上的oozie。