蜂巢和模式演变

时间:2017-09-26 15:26:14

标签: cassandra hive hbase

我们需要创建用户个人资料数据。此配置文件数据/架构将随着时间的推移不断发展,将越来越多的属性添加到配置文件中。可以删除,更新和扩展某些数据。

我想知道Hive + Avro是否是这种用例的好商店(我认为hive不是无模式的,不支持模式演变 - 更适合于不可变的数据)。 HBase / Cassandra会是一个不错的选择吗?

1 个答案:

答案 0 :(得分:0)

使用Hive / Avro进行模式演变很有可能 - 可以找到一个很好的解释here,但是看起来它目前不支持Avro数据集上的ACID插入/更新/删除(虽然支持ORC文件格式)HBase / Cassandra也可用于此用例。这些技术之间的主要区别在于您使用不断发展的数据(读/写性能,底层存储,CAP属性,底层框架(map-reduce或native)进行数据查询摘要等)以及每个技术提供的其他特定功能。这些技术。您可以检查这三个here

之间的并排比较