标签: hadoop
我们运行Hadoop TestDFSIO来强调集群上的磁盘I / O。但是事情变得简单,我注意到在运行写操作时有一个减少阶段,而在运行读操作时更明显。但是我不知道为什么在这种应用程序中需要缩减阶段。我们能否确切知道这三个阶段(映射,随机播放,缩小)会发生什么?