如何在Azure Databricks群集上登录SSH

时间:2017-12-05 06:04:53

标签: azure apache-spark databricks

我使用以下ubuntu命令来访问SSH登录,

ssh user @ hostname_or_IP

  • 能够看到主节点主机名
  • 但无法从Azure Databricks群集中获取用户名

参考此文档, https://docs.azuredatabricks.net/user-guide/clusters/spark-config.html#spark-config

3 个答案:

答案 0 :(得分:9)

不幸的是,我们现在无法通过SSH连接到群集。

我在实验室做了一个测试:

群集配置中有 SSH 部分。但是现在,我们在这里看不到它。

enter image description here

此外,我在资源组中找到了Databricks背后的虚拟机,我尝试从门户更改SSH配置但失败了。然后我发现Databricks资源组已被锁定为只读。您也不能从门户网站中删除它。

enter image description here

我试图找到原因为什么不能在Databricks后面SSH群集,我看到了属于Databricks的VM的NSG规则:

enter image description here

这意味着Azure Databricks只允许一个源来SSH VM,而源是Databricks控制平面。我们也可以在Azure Databricks的架构图片中理解这一点:

enter image description here

Azure Databricks是Azure中的一项新功能。我相信将来会更好。您可以在Azure Feedback Forumthis blog的评论中发表您的想法。 Azure团队将对其进行审核。

希望这有帮助!

答案 1 :(得分:0)

据我所知,您无法在Azure Databricks上进行SSH。

注意: Azure Databricks与Azure Active Directory集成 - 因此,Azure Databricks用户只是常规的AAD用户。

  • Azure Active Directory用户可以直接在Azure Databricks中使用 用于基于用户的访问控制(集群,作业,笔记本等)。
  • Azure Databricks已将用户身份验证委派给AAD启用 单点登录(SSO)和统一身份验证。
  • 笔记本及其输出存储在Databricks帐户中。 但是,基于AAD的访问控制确保只有授权用户 可以访问它们。 enter image description here

答案 2 :(得分:0)

这可能是较新的功能(https://docs.azuredatabricks.net/user-guide/clusters/ssh.html仍未记录) 但是可以设置ssh

在Azure databricks设置并放置驱动程序VM的“公共vnet”中,您需要进入Network Security组并为入站连接添加端口2200(注意,不是默认的SSH端口22)

这是Azure支持专家发送给我的:

enter image description here

然后,您可以在“高级群集设置”下的“ SSH”选项卡中的群集中设置公共密钥 并且您应该能够连接!