我打算在分布式应用程序上工作。数据将进行流式传输和分析。此外,最终用户需要尽快访问最后一个流数据。此外,我需要备份数据并对其进行处理。
我最初的想法如下: 1)将redis保留为缓存以保存最后的条目。 2)MySQL - 存储数据 3)Hadoop / Hbase - 存储数据以便分析的便捷方式。
您如何看待这样的设置?你会推荐别的吗?
谢谢!
答案 0 :(得分:0)
我认为Spark和Cassandra的组合将是一个很好的方式。 Cassandra可以轻松处理数据吞吐量和存储。 Spark提供闪电快速分析。