我注意到,通常使用各种软件包管理器(对于python)安装软件包时,它们会安装在conda上的/home/user/anaconda3/envs/env_name/
和conda上的pip的/home/user/anaconda3/envs/env_name/lib/python3.6/lib-packages/
中。
但是conda也会缓存所有最近下载的软件包。
所以,我的问题是: 为什么conda不将所有软件包都安装在中央位置,然后在特定环境中安装时创建指向目录的链接而不是将其安装在目录中?
我注意到环境变得很大,这种方法可能可以节省一些空间。
答案 0 :(得分:3)
Conda已经做到了。它们利用硬链接,因此如果仅查看特定环境的大小,您可能会高估实际使用的空间。
为说明这种情况,让我们使用du
检查实际磁盘使用情况。首先,如果我分别计算每个环境目录,我会得到每个环境使用情况未修正的信息
$ for d in envs/*; do du -sh $d; done
2.4G envs/pymc36
1.7G envs/pymc3_27
1.4G envs/r-keras
1.7G envs/stan
1.2G envs/velocyto
这是从GUI看起来的样子。
相反,如果我让du
一起计算(即,对硬链接进行更正),我们将得到
$ du -sh envs/*
2.4G envs/pymc36
326M envs/pymc3_27
820M envs/r-keras
927M envs/stan
548M envs/velocyto
可以看到,这里已经节省了大量空间。
大多数硬链接都返回到pkgs
目录,因此,如果我们也将其包括在内:
$ du -sh pkgs envs/*
8.2G pkgs
400M envs/pymc36
116M envs/pymc3_27
92M envs/r-keras
62M envs/stan
162M envs/velocyto
可以看到,在共享软件包之外,env相当轻巧。如果您担心自己的pkgs
的大小,请注意,我从未在此系统上运行conda clean
,因此我的pkgs
目录中充满了tarball和被取代的软件包以及基础架构我保持在 base (例如Jupyter,Git等)中。