HBase架构设计示例

时间:2017-05-05 14:45:35

标签: apache hadoop hbase database-schema nosql

我想了解一下HBase架构设计的一些建议。 例如,有2000名患者,1。每名患者都有姓名,性别,年龄,hospital_ID。 2.每位患者每分钟都会记录心脏位,位置和步数等活动数据。 3.每位患者将接受几份问卷调查。

如何组织HBase表?

非常感谢您的帮助

我目前的想法是使用patient_ID作为行键。每个患者在HBase表中只有一行。但是,所有活动数据都将在嵌套表中进行分组。活动数据表将包含数百万行。 因此,该表将有三个列族。 CF1:info,CF2:activity_data,CF3:问卷调查。

然后, CF1:信息包括(姓名,性别,年龄,身份证)

CF2:activity_data(数据(嵌套表格))

CF3:问卷(questionnaired_ID(嵌套表))

我不知道这是否是设计HBase架构的明智方法。 请给我一些建议。

非常感谢

1 个答案:

答案 0 :(得分:0)

  1. 在设计数据模型时,了解数据的使用情况非常重要,尤其是对于存储在HBase中的数据,您希望有效运行哪些查询(无需全表扫描)。
  2. activity_data似乎是原始数据,但其他两个部分与“患者资料”相关。有一个recommendation可以在同一个表中保持大致相同的列族大小。然后可能最好将activity_data保存在不同的表中,然后聚合以说出每日摘要并将结果存储在“患者配置文件”表中。
  3. 我希望它有所帮助。