Datalab - 如何安装和保存包

时间:2017-10-11 01:00:59

标签: google-cloud-platform google-cloud-datalab

我决定尝试将Google Cloud Datalab用于我正在开发的小型项目,而不是在AWS实例上的Anaconda环境中使用Jupyter Notebook。

如何在Datalab VM上安装软件包(例如OpenCV),以便每次重新启动VM时都不必重新安装它?为什么每次重启后软件包都会消失,但更新后的笔记本仍然存在?任何回答这些问题并澄清Datalab VM如何工作的帮助都会非常有帮助。

1 个答案:

答案 0 :(得分:2)

笔记本电脑存储在一个docker卷安装程序中,该安装程序代表永久磁盘上的一个位置,该位置在VM重新启动时进行维护。

然而,您安装的软件包存储在正在运行的容器中,因此每次重新启动都会丢失。

您可以创建自定义泊坞窗图像并使用它。在datalab create命令中,请参阅--image-name参数。

以下是您要使用的Dockerfile的示例:

FROM gcr.io/cloud-datalab/datalab:latest
RUN pip install opencv

请注意,您需要使用此docker文件构建docker镜像,然后将图像推送到Google Container Registry。我的记忆有点模糊,但这个图像可能需要标记为公开。

希望有所帮助!