CNN keras手写识别准确率高但预测差

时间:2021-05-15 00:32:27

标签: python tensorflow keras deep-learning conv-neural-network

我基本上是为一个学校项目做这件事,并按照一些指南使用 CNN 制作神经元网络。我使用的库是 cv2、NumPy、TensorFlow 和 matplotlib。我目前面临的问题是我的网络具有很高的准确性但预测非常糟糕。我确保图片是倒置的和 28x28 的。我还将要预测的图像数量从 5 扩展到 10。我也尝试添加更多层,但也无济于事。如果有人可以帮助我,那就太棒了!我对此也很陌生,所以请尽你所能解释!

输出示例:As you can see, the hand-writing isn't bad or anything but it still can't predict that it's a 6 but a 1.

Here is the Epoch with an accuracy of 99% basically

代码如下:

import cv2
import numpy as np
import matplotlib.pyplot as plt
import tensorflow as tf


mnist = tf.keras.datasets.mnist
(a_train, b_train), (a_test, b_test) = mnist.load_data()

 a_train = tf.keras.utils.normalize(a_train, axis=1)
 a_test = tf.keras.utils.normalize(a_test, axis=1)
 model = tf.keras.models.Sequential()
 model.add(tf.keras.layers.Flatten(input_shape=(28,28)))
 model.add(tf.keras.layers.Dense(units=255, activation=tf.nn.relu))
 model.add(tf.keras.layers.Dense(units=255, activation=tf.nn.relu))
 model.add(tf.keras.layers.Dense(units=20, activation=tf.nn.softmax))



 model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])

 model.fit(a_train, b_train, epochs=50)

 lost, accuracy = model.evaluate(a_train, b_train)
 print(lost)
 print(accuracy)

 model.save('test.model')

for x in range(1,11):
 img = cv2.imread(fr'C:\Users\Eric\PycharmProjects\pythonProject2\test.model\{x}.png')[:,:,0]
 img = np.invert(np.array([img]))
 prediction = model.predict(img)
 print(f'My Guess is: {np.argmax(prediction)}')
 plt.imshow(img[0], cmap=plt.cm.binary)
 plt.show()

我尝试做的事情: 我尝试添加更多层,假设它会训练并有更好的预测。 我添加了更多的样本数量,看看我是否可以有更高的预测。我从 5 到 10,但仍然有 20% 的正确预测。 我试过改变 Epoch 并尝试更多的批量大小,但也没有用。

我在这一点上几乎卡住了,尽我最大的努力去理解它,但根本无法改进它。如果有人有任何提示,请告诉我!

1 个答案:

答案 0 :(得分:0)

您需要在预测时标准化您的图像。 cv2.imread 创建一个从 0 到 255 的数组。您可以通过将 img 除以 255.

对其进行标准化

您用来预测的图像也应该有黑底白字。

最后,您不需要 np.invert

所以你的代码应该是

for x in range(1, 11):
     img = np.expand_dims(cv2.imread(f'C:\Users\Eric\PycharmProjects\pythonProject2\test.model\{x}.png')[:, :, 0], 0) / 255.
     prediction = model.predict(img)
     print(f'My Guess is: {np.argmax(prediction)}')
     plt.imshow(img[0], cmap=plt.cm.binary)
     plt.show()