标签: apache-spark etl kettle
我对ETL非常了解。我们现在正在使用水壶从消息队列中提取消息,它似乎是流式传输或实时的。我想知道是否有任何明智的理由用火花,暴风雨或火苗代替水壶?换句话说,从解决业务问题的能力的角度来看,水壶和动力中心组与Spark和Flink组之间有什么区别?任何提示将不胜感激。
答案 0 :(得分:0)
答案简短?要计算文本文件中的单词:
带有Spark,flink等。代码为
与Kettle,Informatica一起使用..它是可视的。