Apache flume和Apache storm之间有什么区别?

时间:2017-11-03 17:34:08

标签: hadoop apache-storm flume hortonworks-data-platform

Apache水道和Apache风暴有什么区别?

  • 是否可以使用storm将日志数据提取到Hadoop集群?
  • 两者都用于流媒体数据,因此可以使用风暴作为水槽的替代品吗?

1 个答案:

答案 0 :(得分:4)

  • Apache Flume也是一种用于收集大量流数据的服务,尤其是logs.Flume使用称为数据接收器的机制将数据推送到消费者。 Flume可以直接将数据推送到许多流行的接收器,包括HDFS,HBase,Cassandra和一些关系数据库。
  • Apache Storm涉及流数据。 Storm是批处理和流处理之间的桥梁,Hadoop本身并不是为处理而设计的。 Storm持续运行,处理传入数据流并将其分批,因此Hadoop可以更轻松地获取它。数据源称为spout,每个处理节点都是一个bolt。螺栓对数据执行计算和处理,包括将输出推送到数据存储和其他服务。
  • 如果你需要开箱即用的东西,一旦你决定推或拉是否更有意义,选择Flume。如果流媒体数据目前只是您已经开发的Hadoop环境的一个小插件,那么Storm是一个不错的选择。

  • 可以使用storm

  • 将日志数据提取到Hadoop集群中
  • 是的,我们可以使用风暴作为水槽的替代品