在Colab中处理机密数据是否安全?

时间:2020-03-09 21:02:58

标签: python amazon-web-services unix jupyter-notebook google-colaboratory

使用了一段时间后,我想了解Colab的工作原理,并且可以安全地使用其中的机密数据。

一些上下文。我了解here.中所述的Python,IPython和Jupyter Notebook之间的区别,我将通过总结说Python是一种编程语言来进行总结,并且可以使用sudo apt-get将其安装为任何其他应用程序。 IPython是用于Python的交互式命令行终端,可以与pip(Python的标准软件包管理器)一起安装。它允许您安装和管理不属于Python standard library. Jupyter Notebook的Python编写的其他程序包,向其中添加了一个Web界面,它可以使用多个内核或作为IPython之一的后端。

Colab呢?与使用Colab时相比,这是我的理解,我从Google那里获得了预装Python的VM,以及许多其他库(也称为软件包),例如pandas或matplotlib。这些软件包都安装在基本的python安装中。

Colab VM带有一些临时存储。这等效于AWS.中的实例存储,因此当VM运行时中断(即我们的VM被Google停止(或者您想说...已终止?)时)将丢失。我相信,如果我要上传我的机密数据,它将不会在我的私有子网中……

Mounting因此,我们的驱动器等效于使用EBS volume in AWS. EBS卷是网络连接的驱动器,因此即使VM运行时中断,该磁盘中的数据仍将保留。但是,EBS卷只能附加到一个EC2实例...但是我可以将Drive挂载到多个Colab会话。我不太清楚这些会议是什么... 一些用户想要创建virtual environments in Colab,并且看起来好像挂载驱动器是解决它的一种方法。

将驱动器安装到Colab时,我们需要进行身份验证,因为我们将Colab VM的IP授予了我们的私有子网访问权限。因此,如果我们有一些机密数据,则通过使用Colab,数据将不会离开我们的私有公司子网...?

1 个答案:

答案 0 :(得分:0)

IIUC,最后一段提出了一个问题:“我可以使用基于IP的身份验证来限制对Colab中数据的访问吗?”

答案是否定的:网络地址过滤无法在Colab中提供有意义的访问限制。

Colab是服务而不是机器。 Colab后端没有固定的IP地址或固定的IP地址范围。以此类推,由于没有特定的Google Drive用户组,因此没有IP地址列表,因为Google Drive用户没有固定的IP地址。 Colab用户和后端相似。

您可以尝试使用典型的云端硬盘文件ACL来限制对特定Google帐户的访问,而不是尝试限制对IP的访问。