嗨,我正在玩hdinsight。刚开始在hdinsight中创建集群,但是很难理解如何创建HDFS。它是使用datanode的本地磁盘还是使用azure存储(在创建集群时选择了它),我想增加集群中HDFS的大小,我该怎么做?我应该将托管磁盘附加到每个数据节点吗? 预先感谢。
答案 0 :(得分:0)
欢迎使用HDInsight用户。 HDInsight是Azure上完全托管的大数据服务。 文章:https://docs.microsoft.com/en-us/azure/hdinsight/hdinsight-hadoop-provision-linux-clusters在以下部分:群集的存储端点讨论了可用于HDInsight群集的存储。 https://docs.microsoft.com/en-us/azure/hdinsight/是一个很好的起点。 让我知道是否还有其他问题可以回答。
最好, 艾玛(Amar)
答案 1 :(得分:0)
群集使用Azure Blob存储,该存储将您的数据与群集隔离。 创建HDInsight群集时,可以指定要与其关联的Azure存储帐户。除了此存储帐户之外,您还可以在创建过程中或创建群集之后,从同一Azure订阅或不同的Azure订阅中添加其他存储帐户。
此外,HDInsight使用Azure存储或Azure Data Lake Store作为默认存储,这取决于您在创建群集时选择的选项。
有关添加其他存储帐户的说明,请参见Add additional storage accounts to HDInsight以获得更多详细信息。