虽然我在两台不同的机器上运行相同的CPU版本应用程序,但操作数量略有不同。铬跟踪(TensorBoard)生成的数据如下。从理论上讲,TensorFlow将为具有相同操作数的CPU生成相同的图形。为什么两个不同的CPU在同一个图中有不同的操作次数来运行同一个应用程序?
具有14个内核(28个线程)的英特尔CPU:
4个Conv2DBackpropFilter操作跨越30.404ms
4个Conv2DBackpropInput操作,跨越22.011ms
94 Mul操作跨越19.997ms
108总和操作跨越5.497ms
17平均操作跨越2.731ms
具有16核(32线程)的Intel CPU:
4个Conv2DBackpropFilter操作跨越55.343ms
4个Conv2DBackpropInput操作,跨越47.575ms
84 Mul工作时间跨度为27.384ms
88总和操作跨越10.075毫秒
12个平均操作跨越3.027ms