标签: hadoop hbase
我为我的MR工作进行了一些分析,发现获取表扫描的下一个记录需要花费大约30%的时间在mapper中。据我所知,扫描程序从ActionListener配置的服务器中提取N行,然后在本地迭代它们。
ActionListener
我有什么办法可以减少缓存加载时间吗?这是扫描设置不正确的信号吗?目前的设置:
scan.setCaching
我想到了一个自定义表记录阅读器,它在后台执行预取。