我有一个HBase表,其中添加新数据时,不包括一个列族(数据将被处理并在以后保留)。
批处理作业需要在这些新闻中过滤不具有此特定列值的行,获取它们,计算并更新之前不存在的列。
最初我希望hbase提供一个过滤机制,以获取没有为特定CF定义值的所有行,但似乎hbase不会那样工作。
KEY | CF1 | CF2 | CF3|
A 11 11 11
B 22 22 <-- I need to get these rows.
C 33 33 <-- I need to get these rows.
D 44 44 44
解决此问题的最佳方法是什么?