HBase表作为MapReduce输入?

时间:2015-04-23 20:09:38

标签: hadoop mapreduce hbase nosql

我想知道将HBase表作为mapreduce作业输入有什么优缺点?它如何影响性能?

1 个答案:

答案 0 :(得分:1)

优点: 1.点查找是可能的,无需读取整个数据。

  1. 如果将hbase集成为输入源,则可以完全避免减少阶段,因为可以获取给定密钥的完整数据。
  2. 缺点: 1.如果hbaseBlock大小没有正确调整扫描一个非常小的集合可能会导致扫描完整的基础数据(在最坏的情况下读取1%可能导致读取100%的数据)

    1. 在完全扫描的情况下,直接从hdfs读取是最“首选” 选择 。
    2. 如果“由于跨区域服务器的区域移动而未维护数据字符”,Hbase可能会导致滥用dfs
    3. 总的来说,这完全取决于如何调整hbase取决于他的读/写模式