我决定尝试将Google Cloud Datalab用于我正在开发的小型项目,而不是在AWS实例上的Anaconda环境中使用Jupyter Notebook。
如何在Datalab VM上安装软件包(例如OpenCV),以便每次重新启动VM时都不必重新安装它?为什么每次重启后软件包都会消失,但更新后的笔记本仍然存在?任何回答这些问题并澄清Datalab VM如何工作的帮助都会非常有帮助。
答案 0 :(得分:2)
笔记本电脑存储在一个docker卷安装程序中,该安装程序代表永久磁盘上的一个位置,该位置在VM重新启动时进行维护。
然而,您安装的软件包存储在正在运行的容器中,因此每次重新启动都会丢失。
您可以创建自定义泊坞窗图像并使用它。在datalab create
命令中,请参阅--image-name
参数。
以下是您要使用的Dockerfile的示例:
FROM gcr.io/cloud-datalab/datalab:latest
RUN pip install opencv
请注意,您需要使用此docker文件构建docker镜像,然后将图像推送到Google Container Registry。我的记忆有点模糊,但这个图像可能需要标记为公开。
希望有所帮助!