我有一系列流媒体指标(tf.metrics.accuracy
和custom流媒体micro
,macro
和weighted
F1分数。
在训练期间,我得到了下面的那种情节(永远不要过度拟合)。
这是因为要计算验证集的指标,我调用tf.local_variables_initializer
来重置指标,并且只有验证集的值。
这意味着有两个副作用:
答案 0 :(得分:6)
如果您在培训之间重置指标,则会出现此行为。 如果列车指标是两个不同的操作,则不会对验证指标进行粗略评估。我将举例说明如何使这些指标保持不同以及如何只重置其中一个指标。
玩具示例:
logits = tf.placeholder(tf.int64, [2,3])
labels = tf.Variable([[0, 1, 0], [1, 0, 1]])
#create two different ops
with tf.name_scope('train'):
train_acc, train_acc_op = tf.metrics.accuracy(labels=tf.argmax(labels, 1),
predictions=tf.argmax(logits,1))
with tf.name_scope('valid'):
valid_acc, valid_acc_op = tf.metrics.accuracy(labels=tf.argmax(labels, 1),
predictions=tf.argmax(logits,1))
培训强>
#initialize the local variables has it holds the variables used for metrics calculation.
sess.run(tf.local_variables_initializer())
sess.run(tf.global_variables_initializer())
# initial state
print(sess.run(train_acc, {logits:[[0,1,0],[1,0,1]]}))
print(sess.run(valid_acc, {logits:[[0,1,0],[1,0,1]]}))
#0.0
#0.0
初始状态为预期的0.0
。
现在调用培训操作指标:
#training loop
for _ in range(10):
sess.run(train_acc_op, {logits:[[0,1,0],[1,0,1]]})
print(sess.run(train_acc, {logits:[[0,1,0],[1,0,1]]}))
# 1.0
print(sess.run(valid_acc, {logits:[[0,1,0],[1,0,1]]}))
# 0.0
只有训练准确度得到更新,而有效准确度仍为0.0
。调用有效的操作:
for _ in range(10):
sess.run(valid_acc_op, {logits:[[0,1,0],[0,1,0]]})
print(sess.run(valid_acc, {logits:[[0,1,0],[1,0,1]]}))
#0.5
print(sess.run(train_acc, {logits:[[0,1,0],[1,0,1]]}))
#1.0
此处有效准确度已更新为新值,而训练准确性保持不变。
让我们只重置验证操作:
stream_vars_valid = [v for v in tf.local_variables() if 'valid/' in v.name]
sess.run(tf.variables_initializer(stream_vars_valid))
print(sess.run(valid_acc, {logits:[[0,1,0],[1,0,1]]}))
#0.0
print(sess.run(train_acc, {logits:[[0,1,0],[1,0,1]]}))
#1.0
当训练精度保持不变时,有效精度重置为零。