时间序列数据库和流分析引擎之间的区别,如火花流

时间:2017-08-17 22:15:34

标签: spark-streaming influxdb flink-streaming opentsdb

时间序列数据库可以执行流分析系统(如spark streaming / flink / kinesis analytics)可以做的所有事情吗?

有人包含另一个吗?我不是在寻找哪一个更好。只需了解他们支持的不同用例。

2 个答案:

答案 0 :(得分:1)

时间序列数据库专注于基于时间的条目的存储和检索,其方式比我们的常见关系数据库更高效。鉴于业界对高性能事件处理的兴趣,最近它们再次成为热门话题。如今,它们中的大多数依赖于NoSQL数据库上的特定索引技术,例如OpenTSDB(HBase),InfluxDB(BoltDB)等。

另一方面,像Spark Streaming这样的分布式流处理框架基于对数据流管理系统的研究,并提供更灵活的事件分析方法。它们通常用于进行其他类型的数据分析,例如流上的机器学习,草图,窗口,以及应用多个其他不是时间序列数据库的技术。

它们都起源于2000年代关于时间序列数据库和数据流管理系统的研究,因此一方面的许多特征和架构思想都应用于另一方,反之亦然。这方面的一个例子是开创性的流处理论文“数据流连续查询”(S.Babu,2001)引用时间序列数据库作为相关工作的一个例子。

答案 1 :(得分:0)

时间序列数据库:

根据批量时间限制,数据将由DATABASE消耗。

Spark Streaming: 基于微批次时间,数据将消耗。 Spark Streaming是一个微批处理流媒体系统: