我有10个数据节点,复制因子是3,文件大小是150,块大小是64.因此文件将分成三个块B1,B2,B3。因此,客户端要求Name Node获取用于写入B1块的数据节点的可用性。我的问题是,Name节点将为客户端提供多少数据节点来写入B1块。 还有一个问题是B1,B2,B3的写入将如何并行或顺序发生
答案 0 :(得分:2)
客户端只将数据写入一个数据节点,其余的复制由namenode指令上的数据节点本身完成。
Replica placement
:当datanode从客户端接收块的数据时,datanode将数据保存在表示块的文件中,并同时将数据重新发送到另一个数据节点,该节点应该创建另一个块的复制品。
按顺序复制块