应用错误收集

您所描述的内容可能是可能的，但是 - 您不是在使用Hadoop功能 - 而是试图找到解决方法。

移动计算比移动数据便宜 - 数据位置是Hadoop的基石之一，这也是集群中所有工作节点也是存储的原因节点。 Hadoop尝试在已处理块所在的节点上进行尽可能多的计算，以避免网络拥塞。

https://developer.yahoo.com/hadoop/tutorial/module1.html

然后，Hadoop框架使用来自分布式文件系统的知识，在数据/记录的位置附近调度这些进程。由于文件作为块分布在分布式文件系统中，因此在节点上运行的每个计算进程都对数据的子集进行操作。根据节点的位置选择节点操作的数据：大多数数据从本地磁盘直接读入CPU，减轻网络带宽的压力并防止不必要的网络传输。这种将计算转移到数据的策略，而不是将数据移动到计算中，使Hadoop能够实现高数据局部性，从而实现高性能。
MapReduce往往会生成大量临时文件，因此每个节点15 GB的存储空间不足。