Question

我正在尝试使用已经在MNIST数据库上训练的反向传播技术从头将自己的图像导入神经网络。

代码：

#X - input image
#W1/W2 - Weights
#b1/b2 - biases

def predict(X, W1, W2, b1, b2):
    Z1 = np.dot(W1, X.T) + b1
    A1 = tanh(Z1)
    Z2 = np.dot(W2, A1) + b2
    A2 = softmax(Z2)
    prediction = np.argmax(A2, axis = 0)
    return prediction

chosen_img = x_test[3]

output = predict(chosen_img, W1, W2, b1, b2)
myImg = chosen_img.reshape((28,28))
print(output)

哪里可能是错误

当我尝试从MNIST数据库本身输入图像时，它仍然不起作用。例如，它可以将其输出为output：[7 2 2 7 7 2 2 7 1 2 7 7 2 2 2 7 7 7 7 7 7 7 2 2 7 2 2 2]。

请注意，我在整个NN中使用的是相同代码，因此前馈是相同的，猜测是相同的，权重和偏倚是相同的-并且它确实适用于完整版本，所以我真的不明白，为什么它现在无法正常工作。

我错过了什么吗？感谢您的帮助！

Answer 1

TL; DR：：您正在建立完全连接的网络，而不是CNN，您的输入应为28*28 = 784形状的一维张量，而您的输出应为{{1 }}。

根据问题描述，您正在尝试构建神经网络来对10个数字进行分类。对？因此，您的网络应将形状为MNIST的输入映射到形状为28x28的输出向量（每个数字类的预测概率：0,1，... 9），然后应用{{1 }}以获取预测值。

现在，看看您的10形状：

argmax

输出：

output

# output array from the above issue: output = np.array([7, 2, 2, 7, 7, 2, 2, 7, 1, 2, 7, 7, 2, 2, 2, 7, 7, 7, 7, 7, 7, 7, 2, 2, 7, 2, 2, 2]) print(output.shape)与(28,)。甚至在应用28之前，输出形状为10。因此，这绝对不是我们想要实现的目标。

问题在前进。您正在构建经典的全连接层，但没有将argmax的2D输入张量重塑为形状28x28的1D张量。如果要处理2D输入，则应使用CNN架构。

因此，要解决您的问题，您应该解决输入的所有形状以及偏差，权重。

用预先训练的权重和偏差预测自己的图像无法正常工作

1 个答案: