标签: hadoop hdfs hadoop2 namenode
我在Hadoop中有一个多节点集群,由两台机器组成(每台机器中有一个名称节点和两个数据节点)。
我正在使用:
hadoop fs -put dir1 hdfspath
在上面的命令中:数据是分布在两台机器上还是仅分布在一台机器上?
平衡的方法是:使用hadoop平衡器工具还是可以采用自动方式?
答案 0 :(得分:0)
这取决于两个因素:
如果存储的数据大小超过块大小,数据将被分割为块大小并存储在不同的数据节点中。