可以在创建表格时或在使用其他查询时进行,例如在表格上插入,更新,删除。 我明白使用像BloomFilter这样的选项,BlockCache会产生影响。但我想知道其他可以提高整体吞吐量的技术。任何人都可以展示如何在Hbase表上添加BloomFilter。我想尝试练习。
感谢任何帮助。
答案 0 :(得分:1)
你的问题太笼统了。为了了解如何在HBase中正确构建DataStore,您应该了解其存储的内部逻辑以及数据在区域中的分布方式。这可能是开始的主要场所。我建议你熟悉LSM-tree以及HBase如何在this文章中实现它。在此之后,我建议您阅读有关数据模式here的正确设计,因为它将在您的表现中发挥主要作用。使用良好密钥的正确模式将使您的数据在节点之间正确分布,并避免您遇到hotspotting这样的问题。然后,您可以开始查看优化技术,如blume过滤器,BlockCache,自定义二级索引和其他内容。