Question

我在Hadoop中有一个多节点集群，由两台机器组成（每台机器中有一个名称节点和两个数据节点）。

我正在使用：

hadoop fs -put dir1 hdfspath

在上面的命令中：数据是分布在两台机器上还是仅分布在一台机器上？

平衡的方法是：使用hadoop平衡器工具还是可以采用自动方式？

Answer 1

这取决于两个因素：

如果存储的数据大小超过块大小，数据将被分割为块大小并存储在不同的数据节点中。