在mapreduce作业中随机访问hbase表

时间:2011-12-05 17:00:18

标签: mapreduce hbase

我有一个map reduce作业,其中每个mapper需要多次随机访问另一个HBase表。我想知道对HBase表进行大量随机访问(同时由于映射器同时运行)的效率是多少。

非常感谢!

1 个答案:

答案 0 :(得分:1)

HBase在随机访问时效率很高 - 但是根据地图中表格的大小/减少以及您执行i / o的次数,您可能需要考虑其他选项 例如如果随机/访问表足够小 - 将其加载到每个映射器的内存中(覆盖设置来执行此操作)。如果随机访问表很大,可以考虑运行一个额外的map / reduce来为其他map-reduce准备它(所以你要遍历两个表/统一表)