我需要一个大数据存储解决方案,用于非常规数据的批量插入,这些数据不经常发生,并且对插入的数据进行查询,这些数据经常发生。
我已经通过Cassandra,觉得它对批量插入不太好,但是一个很好的查询解决方案。此外,如果有一种机制可以根据数据属性单独分离数据,那就太好了。
答案 0 :(得分:0)
正如你提到的卡桑德拉,我将谈论它:
你能以一种非破坏的方式插入还是被系统压缩?如果你可以插入unbatched,Cassandra可能很容易处理它。
批量插入也应该可以由Cassandra节点处理,但这不会在所有节点之间正确分配负载(注意:我说的是负载平衡,而不是数据平衡,这只取决于你的分区关键设置)。如果您对Cassandra不是很熟悉,您可以告诉我们您的数据结构和查询类型,我们可以建议您如何使用Cassandra的数据模型来适应它。
对于问题的过滤部分,Cassandra具有群集密钥和二级索引,这基本上就像向群集密钥添加另一个列配置,以便您同时进行查询。