标签: oracle apache-spark dataframe apache-spark-sql hbase
我在oracle数据库上有多个表。我想在Hbase上复制这些表,什么是最好的设计,一个表有多列族,每个列族代表一个oracle表?或Hbase上的多个表,其中一个列族包含多列族的所有字段或多个表(每个列族包含一个列限定符)?
我会在那之后使用spark数据框运行一些工作并像Oracle一样查询!!
亲切
答案 0 :(得分:3)
不鼓励一个表的多列族(超过3列族)。
请参阅hbase manual
所以你有其他选项,你提到它们更适合你的要求和你的设计。