我如何找出cifar10_train tensorflow-gpu基准测试成绩偏高的真正原因?

时间:2018-07-19 13:37:53

标签: tensorflow

我想使用cifar10-train.py基准测试比较source-build tensorflow-gpu .whl和google提供的性能。我的GPU是1080ti,11G,CPU是Intel 4690k,32G。我已经运行了数十个测试,其中每个测试运行3〜5次,最大步长范围为1000到1000,000,例如1000、5000、200000和1000,000。我在测试中应用了相同的最大步数,并且分数(样本/秒)已被累积并按持续时间平均。每次测试的基准分数是通过3〜5倍的平均值计算得出的。我注意到我可以获得非常好的性能,例如,在fedora 28中,我可以得到许多步骤,这些步骤在测试过程中每秒显示超过14000个样本(运行3到5次),甚至某个步骤可以显示约14500个样本/秒 我认为这真的很高。但是,只有在运气好的情况下才能获得这种情况。 通常,我可以得到12000〜13xxx样本/秒。 [根据我的经验,对于ubuntu和Windows,趋势非常相似,但得分略低于fedora。]我不知道为什么可以获得如此幸运的机会。我真的很想知道是什么原因导致这种出色的性能。

起初,我认为GPU的温度或GPU的内存状态可能会影响该分数,因此我已经监视了GPU温度,并尝试过几次重启计算机,但是经过这样的试验,我得出结论不是原因。

0 个答案:

没有答案