我正在寻找模型中的数据泄漏。我在进行掩蔽操作之前正在使用tf.layers.dense
,并且担心模型可能只是学会在输入张量的中间维度上切换位置。
当我有一个输入张量x = tf.ones((2,3,4))
时,tf.layers.dense(x,8)
将x
展平到具有2 * 3 * 4 = 24个输入神经元和2 * 3 * 8 = 48个输出的完全连接层然后,神经元将其重新整形为[2,3,8]
,还是会创建2 * 3 = 6个具有4个输入和8个输出神经元的完全连接层,然后将它们连接起来?
答案 0 :(得分:0)
对于Keras Dense层,在another answer中已经提到,它的输入没有被展平,而是被应用在其输入的最后一个轴上。
对于TensorFlow密集层,它实际上是inherited from Keras Dense layer,因此,与Keras Dense层相同,它的输入是it is applied on the last axis。