标签: hadoop hbase hdfs
我们的Hadoop集群中有两种类型的作业。一项工作使用MapReduce HBase扫描,另一项工作只是纯操作HDFS中的原始文件。在我们的HDFS集群中,部分数据节点也是HBase区域服务器,但其他数据节点则不是。我们希望仅在区域服务器中运行HBase扫描(以利用数据局部性),并在所有数据节点中运行其他类型的作业。这个想法有可能吗?我们可以指定在MapReduce作业配置中使用哪些任务工具吗?
感谢任何帮助。