流媒体数据应该是哪一个?使用AWS中的DynamoDB或Cassandra进行Spark流式传输

时间:2016-10-27 08:14:41

标签: cassandra amazon-dynamodb-streams

我们正在努力存储用户点击数据作为流数据。 我一直在研究在AWS中可能的方法。 一种方法是使用DynamoDB存储数据以及AWS的所有本机工具。 另一种方法是用Cassandra安装火花流。 Datastax提供集成包以在AWS上安装它们。 从我在网上找到的参考文献。 似乎从AWS使用本机DynamoDB可能更昂贵。 但它将节省维护系统的时间。 有没有人以前有过这方面的经验,可以提供一些见解并建议两者的利弊? 此外,我们希望创建一个系统,数据库可以处理批量数据和流式传输,例如lambda架构。因此,流数据和批处理数据都将以相同的数据库结束。据我所知,卡桑德拉对这种情况很有好处。 DynamoDB也支持它吗? 非常感谢你!

0 个答案:

没有答案