Hbase vs Cassandra:对于时间序列数据存储哪个更好?

时间:2014-11-21 17:15:51

标签: hadoop cassandra hbase analytics bigdata

我使用API​​日志来提取如下信息:

  • 在这段时间内,我的API用户有多少?
  • 或者在这段时间内,什么类型的服务被称为最多?

我提取的几乎所有信息都取决于时间戳。实际上我使用MongoDB并添加了时间戳作为索引(对于80GB,索引大小为12GB)。

我建议迁移到cassandra或Hbase。我想知道哪个更好用于我的用例:

  • 分析时间序列数据。
  • 需要良好的写入和读取性能。
  • 使用hadoop进行数据分析的可能性。

感谢您分享您的观点或经验。

2 个答案:

答案 0 :(得分:5)

Cassandra的优点: Cassandra通常表现出更好的性能(尽管两者都很出色)。 从操作的角度来看,Cassandra更容易设置和管理(尽管有一些工具可以帮助这两种方式)。

HBase的优点: 原生于hadoop生态系统

HBase无论如何都会要求你安装hadoop,你会得到一个很好的二合一。要使用Cassandra,您可能需要使用DataStax Enterprise,这是一个商业非开源产品,或者使用Spark进行分析工作,该分析工作具有Cassandra的开源连接器。

答案 1 :(得分:-1)

巧克力或香草冰淇淋 - 哪个更好?

我建议你做最好的决策者。为每个选项设置开发环境,这将告诉您更多关于操作和调优问题的信息,而不是其他任何人可能会给您的。 :)