我有以下培训网络,
graph = tf.Graph()
with graph.as_default():
tf_train_dataset = tf.constant(X_train)
tf_train_labels = tf.constant(y_train)
tf_valid_dataset = tf.constant(X_test)
weights = tf.Variable(tf.truncated_normal([X_train.shape[1], 1]))
biases = tf.Variable(tf.zeros([num_labels]))
logits = tf.nn.softmax(tf.matmul(tf_train_dataset, weights) + biases)
loss = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits, tf_train_labels))
optimizer = tf.train.GradientDescentOptimizer(0.5).minimize(loss)
train_prediction = tf.nn.softmax(logits)
valid_prediction = tf.nn.softmax(tf.matmul(tf_valid_dataset, weights) + biases)
我运行如下,
num_steps = 10
with tf.Session(graph=graph) as session:
tf.initialize_all_variables().run()
print('Initialized')
for step in range(num_steps):
_, l, predictions = session.run([optimizer, loss, train_prediction])
print("Loss: ",l)
print('Training accuracy: %.1f' % sklearn.metrics.accuracy_score(predictions.flatten(), y_train.flatten()))
但它的结果如下:
Initialized
Loss: 0.0
Training accuracy: 0.5
Loss: 0.0
Training accuracy: 0.5
X_train的形状是(213403,25),y_train是(213403,1)以应对logits。我没有将标签编码为热点,因为只有两个类,1或0.我也尝试过二次丢失函数,它仍然是相同的,同样的事情发生了,损失函数没有降低所有。我在这里感觉到一个语法错误,但我一无所知。
答案 0 :(得分:2)
您将标签作为单个列传递(不进行编码)。 模型无法将标签作为因子类型。 因此它将您的标签视为连续值。
损失:0.0表示损失为零。这意味着您的模型完全适合。 发生这种情况是因为您的标签是连续的(回归函数),并且您正在使用softmax_cross_entropy_with_logits损失函数。
尝试传递一个标签的热编码并检查。