应用错误收集

我使用与keras文档页面相同的代码训练了mnist convnet： https://keras.io/examples/mnist_cnn/

在我的RTX 2060上训练12个纪元后，它的准确性达到了84.12％。

Epoch 12/12
60000/60000 [==============================] - 4s 64us/sample - loss: 0.9022 - accuracy: 0.7269 - val_loss: 0.6563 - val_accuracy: 0.8412
Test loss: 0.6562569307327271
Test accuracy: 0.8412

但是，文档声称在GRID K520 GPU上训练12个星期后，它的准确性达到了99.25％。

问题是：如果参数相同，为什么结果与我的结果之间会有如此巨大的差异？这是因为GPU有很大不同吗？也许我的硬件，CUDA设置等出现了问题。（我正在使用tensorflow作为keras后端btw）

我还听说过RTX GPU使用所谓的“张量核心”。这可能是结果不同的原因吗？

为什么我的测试准确性与keras文档中的不同？

0 个答案: