我在两个系统上尝试tensorflow's cifar10-estimator model来评估其GPU性能。配置为:
我按照上面链接的自述页面中指定的说明和命令详细信息进行操作。仅对于cpu设置(--num_gpus = 0),对于PC#1,训练速度从大约26个示例/秒开始,但是对于PC#2,仅9个示例/秒(这是有问题的)。对于一个GPU设置(--num_gpus = 1),最后的训练速度(1000步)对于PC#1是1940个示例/秒,对于PC#2是2400个示例/秒(很好!)。但是对于两个GPU(仅在PC#2上进行了测试),性能与一个GPU(我没想到的)大致相同。
是否有任何指南或解释来理解差异并可能解决问题?