嗨,我正在玩HDInsight。我将日志文件放入Azure存储,然后使用Hive外部表映射到它们。我相信Microsoft推荐Azure存储到HDFS,因此您可以删除并重新创建群集而不会丢失数据。与HDFS相比,可扩展性是什么?我对HDFS的理解是它分布在多个节点上以允许并行处理这与Azure存储的比较。
答案 0 :(得分:0)
在HDInsight上,HDFS存储基于在VM的物理主机中运行的磁盘(在Windows Azure中称为辅助角色的PaaS VM)。
Windows Azure存储具有自己的可伸缩性机制。可伸缩性目标记录在此处:http://msdn.microsoft.com/en-us/library/windowsazure/dn249410.aspx 为了给您一个想法,Windows Azure存储是Windows Azure IaaS VM的操作系统磁盘所在。