我试图从研究论文中复制一个深层神经网络。架构可以在这里找到:
我已经完成了模型的设计,现在我正在尝试准备训练数据。我一直在使用这里的tensorflow教程作为指南:https://www.tensorflow.org/get_started/mnist/pros
在mnist数据的情况下,27x27图像被转换为x的1d向量。另一方面,y_的形状为[none,10],因为每个图像都有可能标记为10种不同的方式(0-9)
x = tf.placeholder(tf.float32, shape=[None, 784])
y_ = tf.placeholder(tf.float32, shape=[None, 10])
我的数据是32x32x7的3d图像,所以x很容易计算。
x = tf.placeholder(tf.float32, shape=[None, 7168])
虽然我的图片是32x32x7,但每个像素都有一个与之关联的密度和标签。我相信密度值将加载到x中,标签将加载到y中。这是一个正确的假设还是我应该以不同的方式加载我的数据?
y_ = tf.placeholder(tf.float32, shape=[None, 7168])
答案 0 :(得分:1)
我的图像是32x32x7,每个像素都有一个与之关联的密度和标签
如果是这样,那么网络的输出和目标y_
将会成形:
[
None, # Batch size
32 * 32 * 7, # Vector size
N # N target labels (one hot encoded)
]