Databricks:安装和直接访问Data Lake Storage Gen 2之间的区别

时间:2019-05-15 10:46:21

标签: azure apache-spark databricks azure-databricks

使用Service pricipal在Databricks上安装Azure Data Lake Store Gen2和使用SAS密钥直接访问之间有什么区别?

我想知道数据传输,访问安全性方面的差异

谢谢

1 个答案:

答案 0 :(得分:2)

如果安装存储,则所有群集上的所有用户都可以访问。

如果您没有使用服务主体或SAS来直接在会话中安装和连接(我不认为BTW正式支持SAS密钥),则该会话中的用户必须有权访问凭据以创建连接。

服务负责人还可以在湖泊中应用较低的杠杆权限,例如限制到某些文件夹。

请注意,使用ADLS Gen2,您现在还可以选择传递用户凭据:https://docs.azuredatabricks.net/spark/latest/data-sources/azure/adls-passthrough.html

我不知道任何性能差异。