HBase作为Web应用程序后端

时间:2012-10-28 18:41:53

标签: hadoop hbase

有人建议将HBase作为基于Web的应用程序的主要数据源是否是个好主意?我主要担心的是HBase对查询的响应时间。是否有可能获得亚秒响应?

编辑:有关应用程序本身的更多详细信息。

  • 数据量:约500GB的文本数据,预计很快就会达到1TB
  • 使用该应用的并发用户数:最多50个

该应用程序将用于显示有关HBase中存储的数据的报告,例如关键字“X”在过去24小时内发生的次数。对于来自该应用程序的约80%的请求,我将知道确切的密钥,20%将是扫描(我正在研究HBase架构设计相关主题以使其快速运行)

2 个答案:

答案 0 :(得分:3)

您可以将HBase用作网络应用的后端(例如参见Gap的演示文稿here或EBay的演示文稿here)。

正如您所指出的那样,重点是获得正确的架构和密钥设计

答案 1 :(得分:2)

是在Hbase上构建一个实时响应的Web应用程序并非不切实际。看一下Opentsdb,它通过web前端公开存储在hbase中的时间序列。尽管Opentsdb已经对存储架构进行了一些优化,但在底层使用了缓存。但是,在Hbase应用程序中更快访问的关键在于RowKey设计。见http://hbase.apache.org/book/rowkey.design.html