为HDInsight群集建立链接存储帐户有什么好处?

时间:2016-07-08 20:48:40

标签: hdinsight azure-data-factory

对于HDInsight群集,必须至少有一个azure存储帐户,这是其默认存储帐户 - 它是必需的,以便将其视为其fs(文件系统)。我得到了。但是可选链接的azure存储帐户呢?至少从ADF(Azure数据工厂)的角度来看,我们是否需要将存储帐户添加为链接存储帐户到HDInsight群集?无论如何,Azure存储帐户只需提供两条信息即帐户名和密钥即可访问。这两件事都在ADF中的链接服务器中指定。这保证了存储帐户的访问权限。从ADF的角度或其他方面,将某个帐户添加为链接存储帐户的真正好处是什么?基本上,我要问的是 - 有没有什么我们不能纯粹使用帐户名称和密钥而不将帐户添加为给定HDInsight群集的链接存储?

2 个答案:

答案 0 :(得分:1)

拥有额外帐户的主要原因是因为它们有限制。存储帐户可以包含500 TB的数据,每秒20000个请求。根据群集的大小和工作负载,您可能会达到请求限制。如果您担心这些限制并且您不想管理大量存储帐户,则应该查看Azure Data Lake。

答案 1 :(得分:0)

我想我有点想出答案。使用链接存储帐户时,群集在用作计算时可以直接访问这些存储帐户上的BLOBS,而无需我们在查询中单独指定存储密钥。这是链接存储必须具备的用例。