spark数据帧和设计Hbase:一个表多列vs多个表一列族

时间:2016-04-29 13:14:22

标签: oracle apache-spark dataframe apache-spark-sql hbase

我在oracle数据库上有多个表。我想在Hbase上复制这些表,什么是最好的设计,一个表有多列族,每个列族代表一个oracle表?或Hbase上的多个表,其中一个列族包含多列族的所有字段或多个表(每个列族包含一个列限定符)?

我会在那之后使用spark数据框运行一些工作并像Oracle一样查询!!

你使用哪种策略?

亲切

1 个答案:

答案 0 :(得分:3)

不鼓励一个表的多列族(超过3列族)。

请参阅hbase manual

所以你有其他选项,你提到它们更适合你的要求和你的设计。