我们的一些Docker镜像需要从Nexus服务器或Internet上下载更大的二进制文件,后者负责分发Java,Node.js,Mobile(Android和iOS)应用程序。例如,使用ADD或RUN指令进行下载。
RUN curl -o docker https://get.docker.com/builds/Linux/x86_64/docker-latest
考虑到命令" docker build"将根据文件的mtime查看指令和缓存,在构建这些图像时利用缓存机制的方法是什么,避免重新下载整个二进制文件? https://stackoverflow.com/a/26612694/433814
另一个问题是,如果资源发生变化,Docker将不会下载最新版本。
答案 0 :(得分:6)
在使用" RUN curl"下载之前,Docker不会查看任何缓存机制。也不是ADD。它将重复下载步骤。但是,如果文件的mtime已更改https://stackoverflow.com/a/26612694/433814,则Docker会使缓存无效。 https://github.com/docker/docker/blob/master/pkg/tarsum/versioning.go#L84
这是我在从文件存储或存储库(如Nexus)构建具有依赖关系的Dockerfiles时一直致力于解决此问题的策略,Amazon S3将从资源中检索ETag,缓存它,并修改缓存标志文件的mdtime。 (https://gist.github.com/marcellodesales/721694c905dc1a2524bc#file-s3update-py-L18)。它遵循Python(https://stackoverflow.com/a/25307587),Node.js(http://bitjudo.com/blog/2014/03/13/building-efficient-dockerfiles-node-dot-js/)项目中执行的方法。
以下是我们可以做的事情:
以下是演示此策略的设置:
创建一个处理HEAD请求并返回ETag标头的Web服务器,通常由服务器返回。
构建映像并验证依赖层是否将首次下载资源
重建图像并验证依赖图层是否使用缓存值。
更改Web Server处理程序返回的ETag值以模拟更改。
再次重建图像并验证是否已使用缓存。
假设您有以下Node.js服务器提供文件。让我们实现HEAD操作并返回一个值。
// You'll see the client-side's output on the console when you run it.
var restify = require('restify');
// Server
var server = restify.createServer({
name: 'myapp',
version: '1.0.0'
});
server.head("/", function (req, res, next) {
res.writeHead(200, {'Content-Type': 'application/json; charset=utf-8',
'ETag': '"{SHA1{465fb0d9b9f143ad691c7c3bcf3801b47284f8555}}"'});
res.end();
return next();
});
server.get("/", function (req, res, next) {
res.writeHead(200, {'Content-Type': 'application/json; charset=utf-8',
'ETag': '"{SHA1{465fb0d9b9f143ad691c7c3bcf3801b47284f8555}}"'});
res.write("The file to be downloaded");
res.end();
return next();
});
server.listen(80, function () {
console.log('%s listening at %s', server.name, server.url);
});
// Client
var client = restify.createJsonClient({
url: 'http://localhost:80',
version: '~1.0'
});
client.head('/', function (err, req, res, obj) {
if(err) console.log("An error ocurred:", err);
else console.log('HEAD / returned headers: %j', res.headers);
});
执行此操作将为您提供:
mdesales@ubuntu [11/27/201411:10:49] ~/dev/icode/fuego/interview (feature/supportLogAuditor *) $ node testserver.js
myapp listening at http://0.0.0.0:8181
HEAD / returned headers: {"content-type":"application/json; charset=utf-8",
"etag":"\"{SHA1{465fb0d9b9f143ad691c7c3bcf3801b47284f8555}}\"",
"date":"Thu, 27 Nov 2014 19:10:50 GMT","connection":"keep-alive"}
考虑以下构建脚本,将ETag标头缓存在文件中。
#!/bin/sh
# Delete the existing first, and get the headers of the server to a file "headers.txt"
# Grep the ETag to a "new-docker.etag" file
# If the file exists, verify if the ETag has changed and/or move/modify the mtime of the file
# Proceed with the "docker build" as usual
rm -f new-docker.etag
curl -I -D headers.txt http://192.168.248.133:8181/ && \
grep -o 'ETag[^*]*' headers.txt > new-docker.etag && \
rm -f headers.txt
if [ ! -f docker.etag ]; then
cp new-docker.etag docker.etag
else
new=$(cat docker.etag)
old=$(cat new-docker.etag)
echo "Old ETag = $old"
echo "New ETag = $new"
if [ "$old" != "$new" ]; then
mv new-docker.etag docker.etag
touch -t 200001010000.00 docker.etag
fi
fi
docker build -t platform.registry.docker.corp.intuit.net/container/mule:3.4.1 .
考虑到我使用当前缓存,建立此结果将如下所示。
mdesales@ubuntu [11/27/201411:54:08] ~/dev/github-intuit/docker-images/platform/mule-3.4 (master) $ ./build.sh
HTTP/1.1 200 OK
Content-Type: application/json; charset=utf-8
ETag: "{SHA1{465fb0d9b9f143ad691c7c3bcf3801b47284f8555}}"
Date: Thu, 27 Nov 2014 19:54:16 GMT
Connection: keep-alive
Old ETag = ETag: "{SHA1{465fb0d9b9f143ad691c7c3bcf3801b47284f8555}}"
New ETag = ETag: "{SHA1{465fb0d9b9f143ad691c7c3bcf3801b47284f8555}}"
Sending build context to Docker daemon 51.71 kB
Sending build context to Docker daemon
Step 0 : FROM core.registry.docker.corp.intuit.net/runtime/java:7
---> 3eb1591273f5
Step 1 : MAINTAINER Marcello_deSales@intuit.com
---> Using cache
---> 9bb8fff83697
Step 2 : WORKDIR /opt
---> Using cache
---> 3e3c96d96fc9
Step 3 : ADD docker.etag /tmp/docker.etag
---> Using cache
---> db3f82289475
Step 4 : RUN cat /tmp/docker.etag
---> Using cache
---> 0d4147a5f5ee
Step 5 : RUN curl -o docker https://get.docker.com/builds/Linux/x86_64/docker-latest
---> Using cache
---> 6bd6e75be322
Successfully built 6bd6e75be322
更改服务器上ETag的值并重新启动服务器以模拟新更新将导致更新缓存标志文件并使缓存失效。例如,Etag改为" 465fb0d9b9f143ad691c7c3bcf3801b47284f8333"。重建将触发新的下载,因为ETag文件已更新,Docker将在" ADD"指令。这里,第5步将再次运行。
mdesales@ubuntu [11/27/201411:54:16] ~/dev/github-intuit/docker-images/platform/mule-3.4 (master) $ ./build.sh
HTTP/1.1 200 OK
Content-Type: application/json; charset=utf-8
ETag: "{SHA1{465fb0d9b9f143ad691c7c3bcf3801b47284f8333}}"
Date: Thu, 27 Nov 2014 19:54:45 GMT
Connection: keep-alive
Old ETag = ETag: "{SHA1{465fb0d9b9f143ad691c7c3bcf3801b47284f8333}}"
New ETag = ETag: "{SHA1{465fb0d9b9f143ad691c7c3bcf3801b47284f8555}}"
Sending build context to Docker daemon 50.69 kB
Sending build context to Docker daemon
Step 0 : FROM core.registry.docker.corp.intuit.net/runtime/java:7
---> 3eb1591273f5
Step 1 : MAINTAINER Marcello_deSales@intuit.com
---> Using cache
---> 9bb8fff83697
Step 2 : WORKDIR /opt
---> Using cache
---> 3e3c96d96fc9
Step 3 : ADD docker.etag /tmp/docker.etag
---> ac3b200c8cdc
Removing intermediate container 4cf0040dbc43
Step 4 : RUN cat /tmp/docker.etag
---> Running in 4dd38d30549a
ETag: "{SHA1{465fb0d9b9f143ad691c7c3bcf3801b47284f8333}}"
---> 4fafbeac2180
Removing intermediate container 4dd38d30549a
Step 5 : RUN curl -o docker https://get.docker.com/builds/Linux/x86_64/docker-latest
---> Running in de920c7a2e28
% Total % Received % Xferd Average Speed Time Time Time Current
Dload Upload Total Spent Left Speed
100 13.5M 100 13.5M 0 0 1361k 0 0:00:10 0:00:10 --:--:-- 2283k
---> 95aff324da85
Removing intermediate container de920c7a2e28
Successfully built 95aff324da85
考虑到ETag没有改变,cache-flag文件将继续保持相同,Docker将使用缓存进行超快速构建。
mdesales@ubuntu [11/27/201411:54:56] ~/dev/github-intuit/docker-images/platform/mule-3.4 (master) $ ./build.sh
HTTP/1.1 200 OK
Content-Type: application/json; charset=utf-8
ETag: "{SHA1{465fb0d9b9f143ad691c7c3bcf3801b47284f8333}}"
Date: Thu, 27 Nov 2014 19:54:58 GMT
Connection: keep-alive
Old ETag = ETag: "{SHA1{465fb0d9b9f143ad691c7c3bcf3801b47284f8333}}"
New ETag = ETag: "{SHA1{465fb0d9b9f143ad691c7c3bcf3801b47284f8333}}"
Sending build context to Docker daemon 51.71 kB
Sending build context to Docker daemon
Step 0 : FROM core.registry.docker.corp.intuit.net/runtime/java:7
---> 3eb1591273f5
Step 1 : MAINTAINER Marcello_deSales@intuit.com
---> Using cache
---> 9bb8fff83697
Step 2 : WORKDIR /opt
---> Using cache
---> 3e3c96d96fc9
Step 3 : ADD docker.etag /tmp/docker.etag
---> Using cache
---> ac3b200c8cdc
Step 4 : RUN cat /tmp/docker.etag
---> Using cache
---> 4fafbeac2180
Step 5 : RUN curl -o docker https://get.docker.com/builds/Linux/x86_64/docker-latest
---> Using cache
---> 95aff324da85
Successfully built 95aff324da85
此策略已用于构建Node.js,Java和其他App服务器或预构建的依赖项。
答案 1 :(得分:2)
我使用类似但更简单的方法:
假设我要添加一个名为mybin
的二进制文件,可以从以下网址下载:http://www.example.com/pub/mybin
我在Jenkins工作中执行以下操作
wget -N http://www.example.com/pub/mybin
在我的Docker文件中,我有:
COPY mybin /usr/local/bin/
选项-N
仅在服务器上更改后才下载二进制文件。我第二次运行wget
工作:
...
Length: 12262118 (12M) [application/octet-stream]
Server file no newer than local file ‘mybin’ -- not retrieving.
docker build
使用缓存。
如果服务器上的二进制文件发生更改(时间戳更改时),wget
会再次下载二进制文件,这会使COPY命令的缓存无效。