我读到docker使用图层,因此在创建container
时使用Dockerfile
时,从基本图像开始,然后后续命令运行向容器添加图层,因此如果保存新容器的状态,你有一个新的图像。我想知道有几件事情。
如果我从Ubuntu
图像开始,这是一个非常庞大且笨重的图像,因为它是一个完整的操作系统,然后我添加了一些工具并将其保存为我上传到集线器的新图像。如果有人下载了我的图片,并且他们已经在images folder
中保存了Ubuntu图片,这是否意味着他们可以跳过下载Ubuntu
,因为他们已经拥有该图片了?如果是这样,当我修改原始图像的某些部分时,这是如何工作的,Docker是否使用其缓存数据在加载后有选择地将这些更改应用于Ubuntu image
?
2.。)如何通过修改Dockerfile来更新我构建的图像?我用这个Dockerfile
设置了一个简单的django项目:
FROM python:3.5
ENV PYTHONBUFFERED 1
ENV APPLICATION_ROOT /app
ENV APP_ENVIRONMENT L
RUN mkdir -p $APPLICATION_ROOT
WORKDIR $APPLICATION_ROOT
ADD requirements.txt $APPLICATION_ROOT
RUN pip install --upgrade pip
RUN pip install -r requirements.txt
ADD . $APPLICATION_ROOT
并用它来开始创建图像。所以每当我创建一个盒子时,它会加载所有这些environment variables
,如果我完全重建盒子,它会重新安装包和所有额外的东西。我需要添加一个新的环境变量,所以我将它添加到Dockerfile
的底部,以及一个测试变量:
ENV COMPOSE_CONVERT_WINDOWS_PATHS 1
ENV TEST_ENV_VAR TEST
当我删除容器和图像,并构建一个新容器时,一切似乎都相应,它告诉我它创建了新的第4步:ENV
COMPOSE_CONVERT_WINDOWS_PATHS 1
---> Running in 75551ea311b2
---> b25b60e29f18
Removing intermediate container 75551ea311b2
所以它就像在某些中间容器转换中丢失了一些东西。这是缓存系统的工作原理,每个新层都是intermediate container
吗?因此,考虑到这一点,如何添加新图层,您是否总是必须在Dockerfile的底部添加新数据?或者在构建映像后将Dockerfile单独保留是否更好,只需修改container
并构建新映像?
编辑我刚刚尝试安装了一个名为bwawrik/bioinformatics
的图片,这是一个基于CentOS的容器,它安装了各种各样的工具。
它冻结了一半,所以我退出了它,然后再次运行它,看看是否已经安装了所有东西:
$ docker pull bwawrik/bioinformatics
Using default tag: latest
latest: Pulling from bwawrik/bioinformatics
a3ed95caeb02: Already exists
a3ed95caeb02: Already exists
7e78dbe53fdd: Already exists
ebcc98113eaa: Already exists
598d3c8fd678: Already exists
12520d1e1960: Already exists
9b4912d2bc7b: Already exists
c64f941884ae: Already exists
24371a4298bf: Already exists
993de48846f3: Already exists
2231b3c00b9e: Already exists
2d67c793630d: Already exists
d43673e70e8e: Already exists
fe4f50dda611: Already exists
33300f752b24: Already exists
b4eec31201d8: Already exists
f34092f697e8: Already exists
e49521d8fb4f: Already exists
8349c93680fe: Already exists
929d44a7a5a1: Already exists
09a30957f0fb: Already exists
4611e742e0b5: Already exists
25aacf0148db: Already exists
74da82504b6c: Already exists
3e0aac083b86: Already exists
f52c7e0ac000: Already exists
35eee92aaf2f: Already exists
5f6d8eb70885: Already exists
536920bfe266: Already exists
98638e678c51: Already exists
9123956b991d: Already exists
1c4c8a29cd65: Already exists
1804bf352a97: Already exists
aa6fe9359956: Already exists
e7e38d1250a9: Already exists
05e935c831dc: Already exists
b7dfc22c26f3: Already exists
1514d4797ffd: Already exists
Digest: sha256:0391808e21b7b5cc0eb44fc2dad0d7f5415115bdaafb4534c0b6a12efd47a88b
Status: Image is up to date for bwawrik/bioinformatics:latest
所以它确实将包装成碎片,而不是一次性安装。这些是不同的图像吗?
答案 0 :(得分:52)
首先,让我澄清一些术语。
image :一个静态的,不可变的对象。这是您使用docker build
运行Dockerfile
时构建的内容。图像不是运行的东西。
图像由图层组成。图像可能只有一个图层,或者可能有多个图层。
容器:正在运行的东西。它使用图像作为起始模板。
这类似于二进制程序和进程。您在磁盘上有一个二进制程序(例如/bin/sh
),当您运行它时,它是您系统上的一个进程。这类似于图像和容器之间的关系。
您可以从基本图像(例如示例中的ubuntu
)构建自己的图像。 Dockerfile
中的某些命令会在最终图像中创建一个新图层。其中一些是RUN
,COPY
和ADD
。
第一层没有父图层。但是每个其他层都有一个父层。通过这种方式,它们相互连接,像煎饼一样堆叠起来。
每个图层都有一个唯一的ID(您已经看过的长十六进制哈希值)。它们还可以包含人性化的名称,称为标记(例如ubuntu:16.04
)。
从技术上讲,每个图层也是一个图像。如果您构建一个新图像并且它有5个图层,则可以使用该图像,它将包含所有5个图层。如果使用堆栈中的第三层作为图像ID运行容器,也可以这样做 - 但它只包含3层。你指定的那个和它的祖先是两个。
但作为惯例,术语"图像"通常表示具有关联标记的图层。当您运行docker images
时,它会显示所有顶级图片,并隐藏下面的图层(但您可以使用-a
显示所有图片。)
当docker build
运行时,它会在容器内完成所有工作(当然!)因此,如果它遇到RUN
步骤,它将从当前顶层创建一个容器,运行指定的其中的命令,然后将结果保存为新图层。然后它将从这个新层创建一个容器,运行下一个......等等。
中间容器仅用于构建过程,并在构建后被丢弃。
您询问是否有人下载基于ubuntu
的图片只是部分下载,如果他们已在本地拥有ubuntu
图片。
是的!这完全正确。
每个图层都使用它下面的图层作为基础。新图层基本上是该图层与新状态之间的差异。但是,与git提交可能有效的方式不同,它不是差异。它适用于文件级别,而不是行级别。
假设您从ubuntu
开始,并且运行了此Dockerfile。
FROM: ubuntu:16.04
RUN groupadd dan && useradd -g dan dan
这将产生两层图像。第一层是ubuntu
图像。第二个可能只有一些变化。
/etc/passwd
的较新副本
/etc/group
的新版本,其中包含" dan" /home/dan
/home/dan/.bashrc
就是这样。如果您从此图像启动容器,那么这几个文件将位于最顶层,其他所有文件都来自ubuntu
图像中的文件系统。
另一点。运行容器时,可以在文件系统中写入文件。但是,如果您停止容器并从同一图像运行另一个容器,则会重置所有内容。那么文件在哪里写的?
图像是不可变的,所以一旦它们存在,它们就无法改变。您可以构建新版本,但这是一个新图像。它将具有不同的ID,并且不会是相同的图像。
容器具有顶层读写层,该层位于图像层之上。任何写入都发生在该层中。它就像其他层一样工作。如果您需要修改文件(或添加一个或删除一个文件),则在顶层完成,并且不会影响较低层。如果文件已存在,则将其复制到读写层,然后进行修改。这称为写时复制(CoW)。
您是否必须在Dockerfile的底部添加新内容?不,你可以在任何地方添加任何东西(或改变任何东西)。
但是,由于构建缓存的工作原理,您的工作方式确实会影响构建时间。
Docker将尝试在构建期间缓存结果。如果它在通过Dockerfile读取时发现FROM
是相同的,则第一个RUN
是相同的,第二个RUN
是相同的...它将假设它已经完成这些步骤,将使用缓存的结果。如果遇到与上一次构建不同的内容,则会使缓存无效。从那时起,一切都将重新焕发新生。
有些事情总是会使缓存失效。例如,如果您使用ADD
或COPY
,那些始终会使缓存无效。这是因为Docker只跟踪构建命令是什么。它并没有试图找出"这个版本的文件我是否正在复制与上次相同的文件?"
因此,通常的做法是从FROM
开始,然后放置非常静态的内容,例如安装包的RUN
命令。 apt-get
等等。在最初编写Dockerfile之后,这些事情往往不会发生很大变化。稍后在文件中放置更频繁更改的内容会更方便。
很难简明扼要地提出这方面的建议,因为这实际上取决于相关项目。但要了解构建缓存是如何工作并尝试利用它的,这是值得的。