HBASE:Column Family相关的操作,事后呢?

时间:2013-07-01 10:28:53

标签: hadoop hbase etl column-family

有没有办法将列族拆分成多个家族 - 事后 - 在HBase?

这显然是一个坏主意,但在某些情况下可能是值得的,即

1)如果你有足够的时间让你的HBase服务器离线,并且有机会优化一些只与几列相关的mapreduce作业。

2)你是从sqoop导入的(sqoop上没有专家,但默认情况下它会显示为将数据库的每一行映射到一个列族中 - 如果错误则更正)。

3)您只是在应用程序的早期忽略了一些访问模式。

相关

有没有办法将列族合并到一个新表中(即当基数充分偏离时,为了提高性能会更好)?

1 个答案:

答案 0 :(得分:1)

我们使用批量加载完成了它。我们必须编写MR作业,使用HFileOutputFormat从一个列族拆分为两个列族。

使用completebulkload

将此输出加载到hbase