是否有可能创建一个神经网络,我们在输出层中有一个神经元,可以在训练后直接预测来自NMIST数据集的数字。例如,如果我们给出数字3作为输入,输出层神经元应该给出接近3的输出值。
注意:可能有任意数量的神经元具有任意数量的隐藏层。
提前致谢。
这是我尝试使用Tensorflow。
import tensorflow as tf
from mnist import MNIST
import numpy as np
inputs = tf.placeholder(tf.float32, shape=(1, 784))
labels = tf.placeholder(tf.float32, shape=(1, 1))
logits = tf.layers.dense(inputs, 1)
loss = 9.0 * tf.sigmoid(logits) - labels # As we want predicted value in [0 - 9]
train_op = tf.train.GradientDescentOptimizer(0.01).minimize(loss)
init = tf.global_variables_initializer()
with tf.Session() as sess:
sess.run(init)
mnist = MNIST()
for i in range(100001):
data, label = mnist.get_train_data()
lab = np.zeros((1,1), np.float32)
lab[0][0] = label
_, _loss, _logits= sess.run([train_op, loss, logits], feed_dict={inputs: np.reshape(data, (1, 784)), labels: lab})
if i%5000 == 0:
print("Step: %d Loss: %6f <== logits %s, Actual: %6f" % (i, _loss, str(_logits), label))
Step: 0 Loss: -0.436195 <== logits [[ 0.02835961]], Actual: 5.000000
Step: 5000 Loss: -6.999933 <== logits [[-11.80182171]], Actual: 7.000000
Step: 10000 Loss: -2.999990 <== logits [[-13.7065649]], Actual: 3.000000
Step: 15000 Loss: -4.999864 <== logits [[-11.09644413]], Actual: 5.000000
Step: 20000 Loss: -5.000000 <== logits [[-17.01583481]], Actual: 5.000000
Step: 25000 Loss: -2.999971 <== logits [[-12.66251564]], Actual: 3.000000
Step: 30000 Loss: -2.999927 <== logits [[-11.72266102]], Actual: 3.000000
Step: 35000 Loss: -0.999898 <== logits [[-11.38729763]], Actual: 1.000000
Step: 40000 Loss: -7.000000 <== logits [[-17.59585381]], Actual: 7.000000
Step: 45000 Loss: -3.000000 <== logits [[-17.72655296]], Actual: 3.000000
Step: 50000 Loss: -5.000000 <== logits [[-16.65830421]], Actual: 5.000000
Step: 55000 Loss: -6.999999 <== logits [[-15.97771645]], Actual: 7.000000
Step: 60000 Loss: -3.000000 <== logits [[-17.10641289]], Actual: 3.000000
Step: 65000 Loss: -4.999984 <== logits [[-13.26896667]], Actual: 5.000000
Step: 70000 Loss: -5.000000 <== logits [[-19.57778549]], Actual: 5.000000
Step: 75000 Loss: -2.999995 <== logits [[-14.30502892]], Actual: 3.000000
Step: 80000 Loss: -2.999982 <== logits [[-13.13857365]], Actual: 3.000000
Step: 85000 Loss: -0.999971 <== logits [[-12.63682747]], Actual: 1.000000
Step: 90000 Loss: -7.000000 <== logits [[-19.08620071]], Actual: 7.000000
Step: 95000 Loss: -3.000000 <== logits [[-19.23719406]], Actual: 3.000000
Step: 100000 Loss: -5.000000 <== logits [[-17.85402298]], Actual: 5.000000
答案 0 :(得分:1)
当然可以,但这不是一个好主意。数字识别是一种分类问题。通过仅使用单个输出神经元,您建议将其视为回归问题。你所隐含的假设是,在数字上彼此接近的数字也看起来相似。显然情况并非如此。例如,3
和5
看起来比3
和4
更相似,因为底部是相同的。
答案 1 :(得分:0)
我同意@Geerth,但想加一点。实际上,如果您使用回归模型而不是分类,那就是真实的。但回归模型假设您的输入是有序的(您可以使用任何订单,例如1,2,3 ....或1,3,2,5,4或任何其他订单,您的模型将具有不同的参数)。 "Introduction to Statistical Learning"本书对此有一些好主意(并且它是免费的)。