假设有一个文件200MB,块大小为64MB,获得4个块:
block 1, 64MB, stored in datanode 1.
block 2, 64MB, stored in datanode 2.
block 3, 64MB, stored in datanode 3.
block 4, 8MB, stored in datanode 4.
(假设不同的数据节点位于不同的计算机上)
将splitsize设置为100MB,然后此文件将获得2个输入分割,
分割1,包括区块1 +区块2的36MB,
拆分2,包括第2块+第3块+第4块的28 MB,
我的问题是
非常感谢,