应用错误收集

我希望每个hadoop映射器在M / R作业中处理单独的数据部分，并且我想在伪分布式（单节点）设置上测试需要存在许多映射器的情况。输入数据大小更大的结果。鉴于我当前输入的大小和我正在试验的独立模式，我只能看到1个地图任务。

我的输入来自hbase表，我认为每个hbase表的区域数等于用于处理表数据的映射器数。

因此，为了重现许多映射器处理输入数据的情况，我通过shell预定了表的区域，如下所示：

创建't1'，'f1'，{NUMREGIONS =＆gt; 4，SPLITALGO =＆gt; 'HexStringSplit'}

或将'UniformSplit'设置为SPLITALGO，但即使映射器确实增加到指定数量的区域（在将数据导入到相应的表之后），所有输入数据（在后续测试作业中）在我试图从这个表中读取的地方）通过只有一个映射器 - 其他人不处理任何输入行。

我在伪分布式（单节点）设置上工作，我真的不知道如何解决这个问题。有没有人有任何想法？谢谢！