我们试图为我们的交易系统建立一个数据仓库
- 我们每天进行5000 -6000交易,他们可以去> 20,000。
- 每个交易产生一个文件,大小(> 4MB)
我们希望拥有一个系统,它可以对现有数据进行更新,一致性和可用性,并具有良好的读取性能。基础设施不是问题。
Hbase或cassandra还是其他?非常感谢您的帮助和指导。
非常感谢!
答案 0 :(得分:0)
大多数较新的nosql平台可以在性能方面做到所需 - hbase和cassandra水平扩展(也可以是Aerospike等),因此如果数据模型尊重"产品模式&#,则可以保证性能34;用于数据分发。
我不会在性能方面选择技术。 我会做的是:
虽然1很容易完成,但2需要深入的产品分析。例如,您说您需要更新现有数据 - 让我们假设您选择Cassandra并且非常频繁地更新一个列,您可以在该列上放置一个二级索引(在引擎盖下创建一个查找表)以进行搜索目的。每次在查找表上对此列执行更新时,都会执行删除和插入操作。您可以在此article中读到,在Cassandra中执行许多删除操作被视为反模式并且可能导致出现问题。这只是我在Cassandra上做的一个例子,因为这是我在nosql产品中最了解的一个例子,而不是告诉你避免使用Cassandra。