标签: hadoop hbase
插入发生后是否有一种简单的方法可以重新计算某些值?我有一个包含多个列族的表,其中一个是统计的。我想插入原始记录,而不是使用一些特定于HBase的工具来离线计算值 - 而不会阻止插入。
我们假设我将一些文件放入hbase表中,并希望获得有关其中行数以及存储在那里的日期的信息。
我一直在研究RegionObserver及其preGet方法。这个解决方案有效,但我担心它会阻止实际的插入发生,直到计算完成。
答案 0 :(得分:1)
使用postPut方法。您可以看到HBase的协处理器here
答案 1 :(得分:1)
尝试apache Pig,这最适合于stasticl计算,可以在本地和mapred模式下运行
有关详细信息,请访问
http://pig.apache.com