我有两台机器的集群,一台作为主机,两台作为从机(主机也是从机)。我在两台机器中都将复制因子设置为1。 Hive也在master上配置。几天后,我的硬盘已满(没有剩余空间),然后我运行了以下命令:
hadoop dfs -setrep -w 1 -R /
执行此命令后,可用的存储空间很大。
为什么是这样?我知道setrep
命令用于将每个块的复制因子设置为1.当我在配置中放入条件时,这是什么?我该如何摆脱它?
答案 0 :(得分:0)
您需要在配置文件中设置setrep并重新启动群集
<property>
<name>dfs.replication</name>
<value>1</value>
</property>