实时查询 - 最适合的HBase还是Cassandra?

时间:2014-10-12 07:12:51

标签: cassandra hbase

我们试图为我们的交易系统建立一个数据仓库 - 我们每天进行5000 -6000交易,他们可以去> 20,000。
- 每个交易产生一个文件,大小(> 4MB)

我们希望拥有一个系统,它可以对现有数据进行更新,一致性和可用性,并具有良好的读取性能。基础设施不是问题。

Hbase或cassandra还是其他?非常感谢您的帮助和指导。

非常感谢!

1 个答案:

答案 0 :(得分:0)

大多数较新的nosql平台可以在性能方面做到所需 - hbase和cassandra水平扩展(也可以是Aerospike等),因此如果数据模型尊重"产品模式&#,则可以保证性能34;用于数据分发。

我不会在性能方面选择技术。 我会做的是:

  1. 一系列产品提供的不同功能列表,然后考虑开箱即用,最符合我需求的产品
  2. 我需要对数据执行的操作列表,并检查我是否不会" 反对"一些特定的产品
  3. 虽然1很容易完成,但2需要深入的产品分析。例如,您说您需要更新现有数据 - 让我们假设您选择Cassandra并且非常频繁地更新一个列,您可以在该列上放置一个二级索引(在引擎盖下创建一个查找表)以进行搜索目的。每次在查找表上对此列执行更新时,都会执行删除和插入操作。您可以在此article中读到,在Cassandra中执行许多删除操作被视为反模式并且可能导致出现问题。这只是我在Cassandra上做的一个例子,因为这是我在nosql产品中最了解的一个例子,而不是告诉你避免使用Cassandra。