应用错误收集

Ambari中有一个Config Groups的概念，这里有一个概念。默认情况下，群集中的所有节点都只是一个配置组的一部分。因此，该组中的任何配置都适用于所有节点。在这种情况下，如果您将dfs.datanode.data.dir设置为/mnt/vol1，Ambari将在每个节点上检查此目录。如果存在，则数据节点的数据将存储在该目录中。否则，它被忽略了。

因此，在您的情况下，对于Node1，使用此目录，但对于其他节点，由于此目录不可用，因此不会使用它。如果dfs.datanode.data.dir配置中没有提到其他目录，我想如果您的复制因子设置为3，您可能会看到复制不足。

从本质上讲，您可以做的是为具有已安装存储卷的计算机分配一个配置组，然后将dfs.datanode.data.dir设置为/mnt/vol1，并为其他两个节点设置另一个配置组然后在此属性中提供适当的值。这应该可以解决您的问题。

检查以下链接，了解有关配置组的更多信息：

https://developer.ibm.com/hadoop/2015/11/10/override-component-configurations-with-ambari-configuration-groups/

https://docs.hortonworks.com/HDPDocuments/Ambari-2.1.1.0/bk_Ambari_Users_Guide/content/_using_host_config_groups.html

如何在Hadoop中的各个数据节点上设置单个数据节点目录？

1 个答案: