HDInsight Azure Blob存储数据更新

时间:2014-03-26 10:02:55

标签: hadoop hive hdinsight hadoop-partitioning azure-storage-blobs

我正在考虑将HDInsight与Hive一起使用,并在Azure Blob存储上加载数据 历史数据和不断变化的数据相结合 Update , SET option in Hive中提到的解决方案是否也适用于blob存储? 下面的Hive语句也改变了blob存储中的数据,这也是我的要求吗?

INSERT OVERWRITE TABLE _tableName_ PARTITION ...

1 个答案:

答案 0 :(得分:1)

INSERT OVERWRITE会将新文件写入群集文件系统。在HDInsight中,文件系统由Azure blob支持,wasb://...wasb:///...名称。 Hive对群集文件系统所做的一切,如覆盖它们,将相应地反映在Azure存储BLOB中。有关详细信息,请参阅Use Hive with HDInsight