我使用与keras文档页面相同的代码训练了mnist convnet: https://keras.io/examples/mnist_cnn/
在我的RTX 2060上训练12个纪元后,它的准确性达到了84.12%。
Epoch 12/12
60000/60000 [==============================] - 4s 64us/sample - loss: 0.9022 - accuracy: 0.7269 - val_loss: 0.6563 - val_accuracy: 0.8412
Test loss: 0.6562569307327271
Test accuracy: 0.8412
但是,文档声称在GRID K520 GPU上训练12个星期后,它的准确性达到了99.25%。
问题是:如果参数相同,为什么结果与我的结果之间会有如此巨大的差异? 这是因为GPU有很大不同吗?也许我的硬件,CUDA设置等出现了问题。(我正在使用tensorflow作为keras后端btw)
我还听说过RTX GPU使用所谓的“张量核心”。这可能是结果不同的原因吗?