可用于创建数据管道的不同工具

时间:2016-08-25 18:42:29

标签: hadoop cloudera data-pipeline

我需要在hadoop中创建数据管道。我有数据导入,导出,脚本来清理数据设置,现在需要在管道中设置它。

我一直在使用Oozie进行数据导入和导出计划,但现在也需要集成R脚本来进行数据清理过程。

我看到falcon也用于此。

  1. 如何在cloudera中安装falcon?
  2. 还有哪些其他工具可用于在hadoop中创建数据管道?

1 个答案:

答案 0 :(得分:1)

2)我很想回答Hortonworks的nifi,因为post on linkedin它已经发展了很多,而且非常接近取代oozie。当我写这个答案时,oozie和nifi之间的区别就在于它们运行的​​地方:外部集群上的nifi和oo上的oozie。