如何在Hadoop中的Datanode之间平衡数据?

时间:2017-03-25 10:02:12

标签: hadoop hdfs hadoop2 namenode

我在Hadoop中有一个多节点集群,由两台机器组成(每台机器中有一个名称节点和两个数据节点)。

我正在使用:

hadoop fs -put dir1 hdfspath

在上面的命令中:数据是分布在两台机器上还是仅分布在一台机器上?

平衡的方法是:使用hadoop平衡器工具还是可以采用自动方式?

1 个答案:

答案 0 :(得分:0)

这取决于两个因素:

  • 您存储的数据大小
  • 为您的数据节点定义的块大小。

如果存储的数据大小超过块大小,数据将被分割为块大小并存储在不同的数据节点中。