我在Windows中使用caffe的命令行版本来训练网络。系统中有两个GPU(GTX 1080)。当我仅使用CPU进行训练或使用两个中的任何一个指定单个GPU使用时,网络正确训练。如果选择“gpu all”选项用于训练,则两个GPU可以很好地识别,但是在完成测试网络的初始化之前我获得了“分段错误”,并且traininig没有启动。
那是因为我认为这是multiGPU配置的问题。我已经做了一些测试构建caffe启用和禁用选项USE_NCCL(= 1和= 0),但我在两种情况下都获得了相同的行为。我已经从windows分支构建了caffe。
我在Nvida网站上也读过NCCL在使用多个GPU时需要caffe,但是只有NCCL安装程序的Linux版本。是否有必要在Windows中单独安装NCCL才能使用多个GPU?我还读到,自今年年初以来NCCL已集成在官方caffe中,但是它是集成在windows分支中还是单独安装在windows中是强制性的?我找不到在Windows 7中安装的方法。谢谢