标签: hadoop hbase yarn
我们的情况是我们托管数据:
全部在同一个群集/表中。
使用YARN,我们可以管理CPU和RAM等资源,但在密集扫描期间,HDD可能成为瓶颈,并且可能会降低随机读取性能。如何管理该资源
一般情况下如何处理这种情况?
答案 0 :(得分:0)
由于mapreduce一般不需要实时数据,人们经常备份hbase表并在备份数据表上运行mapreduce。或者做一个表的快照并运行mp。在上面。