我正在尝试在三台ubuntu 16.04机器(带有geforce 1070卡的i7处理器)上配置horvod。尽管我已经成功配置了下面给出的每台机器和horovod示例,但是可以成功地在每个节点上工作:(在单台机器上运行)
<IfModule mod_headers.c>
<FilesMatch "^(\.css|\.js)$">
Header set Cache-Control "max-age=60480, public"
</FilesMatch>
<FilesMatch "^\.min\.(js|css)$">
Header set Cache-Control "max-age=60480, public"
</FilesMatch>
<FilesMatch "^\.min\.(js|css)\.(br|gz)$">
Header set Cache-Control "max-age=60480, public"
</FilesMatch>
</IfModule>
但是,我无法在计算机上运行以下命令(在多台计算机上运行):
nvidia-docker run -it horovod:latest
root@c278c88dd552:/examples# mpirun -np 4 -H localhost:4 python keras_mnist_advanced.py
我还配置了link推荐的每三台计算机的无密码登录名
我是ubuntu的新手,我相信我无法理解分布式代码中的sudo nvidia-docker run -it --network=host -v /mnt/share/ssh:/root/.ssh horovod:latest root@c278c88dd552:/examples# mpirun -np 3 -H host1:1,host2:1,host3:1 \
-mca plm_rsh_args "-p 12345" python keras_mnist_advanced.py
。
如果有人可以帮助我完成代码,那就太好了。
致谢