还原作为Tensorflow中新模型子集的变量?

时间:2017-02-14 03:22:57

标签: python variables tensorflow restore

我正在通过Tensorflow进行增强(4层DNN到5层DNN)的示例。我正在使用保存会话并在TF中恢复,因为TF tute中有一个简短的段落: '例如,你可能已经训练了一个有4层的神经网络,你现在想要训练一个有5层的新模型,将先前训练过的模型的4层中的参数恢复到新模型的前4层。 ',其中tensorflow tute在https://www.tensorflow.org/how_tos/variables/启发。

然而,我发现当检查点保存4层参数时,没有人问过如何使用'恢复',但是我们需要将它放到5层,引起一个红旗。

在实际代码中制作,我做了

with tf.name_scope('fcl1'):
    hidden_1 = fully_connected_layer(inputs, train_data.inputs.shape[1], num_hidden)            
with tf.name_scope('fcl2'):
    hidden_2 = fully_connected_layer(hidden_1, num_hidden, num_hidden)                
with tf.name_scope('fclf'):
    hidden_final = fully_connected_layer(hidden_2, num_hidden, num_hidden)    
with tf.name_scope('outputl'):
    outputs = fully_connected_layer(hidden_final, num_hidden, train_data.num_classes, tf.identity)
    outputs = tf.nn.softmax(outputs)
with tf.name_scope('boosting'):
    boosts = fully_connected_layer(outputs, train_data.num_classes, train_data.num_classes, tf.identity)

其中变量里面(或称为'fcl1') - 所以我有'fcl1 / Variable'和'fcl1 / Variable_1'的权重和偏见 - 'fcl2','fclf'和'outputl'存储没有'boosting'层的脚本中的saver.save()。但是,由于我们现在有'提升'层,saver.restore(sess,“saved_models / model_list.ckpt”)不起作用

NotFoundError: Key boosting/Variable_1 not found in checkpoint

我真的希望听到这个问题。谢谢。 下面的代码是我遇到麻烦的代码的主要部分。

def fully_connected_layer(inputs, input_dim, output_dim, nonlinearity=tf.nn.relu):
    weights = tf.Variable(
        tf.truncated_normal(
            [input_dim, output_dim], stddev=2. / (input_dim + output_dim)**0.5), 
        'weights')
    biases = tf.Variable(tf.zeros([output_dim]), 'biases')
    outputs = nonlinearity(tf.matmul(inputs, weights) + biases)    

    return outputs

inputs = tf.placeholder(tf.float32, [None, train_data.inputs.shape[1]], 'inputs')
targets = tf.placeholder(tf.float32, [None, train_data.num_classes], 'targets')

with tf.name_scope('fcl1'):
    hidden_1 = fully_connected_layer(inputs, train_data.inputs.shape[1], num_hidden)            
with tf.name_scope('fcl2'):
    hidden_2 = fully_connected_layer(hidden_1, num_hidden, num_hidden)                
with tf.name_scope('fclf'):
    hidden_final = fully_connected_layer(hidden_2, num_hidden, num_hidden)    
with tf.name_scope('outputl'):
    outputs = fully_connected_layer(hidden_final, num_hidden, train_data.num_classes, tf.identity)

with tf.name_scope('error'):    
    error = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(outputs, targets))
with tf.name_scope('accuracy'):
    accuracy = tf.reduce_mean(tf.cast(
        tf.equal(tf.argmax(outputs, 1), tf.argmax(targets, 1)), 
        tf.float32))
with tf.name_scope('train'):
    train_step = tf.train.AdamOptimizer().minimize(error)

init = tf.global_variables_initializer()  
saver = tf.train.Saver()

with tf.Session() as sess:
    sess.run(init)
    saver.restore(sess, "saved_models/model.ckpt")
    print("Model restored")

    print("Optimization Starts!")
    for e in range(training_epochs):
        ...

   #Save model - save session        
    save_path = saver.save(sess, "saved_models/model.ckpt")
    ### I once saved the variables using var_list, but didn't work as well...
    print("Model saved in file: %s" % save_path)

为清楚起见,检查点文件有

fcl1/Variable:0

fcl1/Variable_1:0

fcl2/Variable:0

fcl2/Variable_1:0

fclf/Variable:0

fclf/Variable_1:0

outputl/Variable:0

outputl/Variable_1:0

由于原始的4层模型没有“增强”层。

1 个答案:

答案 0 :(得分:14)

在这种情况下,从检查点读取增值的值并不正确,我认为这不是你想要做的。显然你会收到错误,因为在恢复变量时,你首先要捕获模型中所有变量的列表,然后在检查点中查找相应的变量,而这些变量并没有。

您可以通过定义模型变量的子集来仅恢复模型的一部分。例如,您可以使用tf.slim库来完成。获取模型中的变量列表:

getSupportFragmentManager().findFragmentByTag(mPagerAdapter.makeFragmentTag(0) //Postion of fragment to access 

现在变量是张量列表,但是对于每个元素,您可以访问其name属性。使用它可以指定您只想恢复除了增强之外的层,例如:

variables = slim.get_variables_to_restore()

这样您将恢复4层。从理论上讲,你可以尝试从检查点捕获一个变量的值,方法是创建另一个服务器,它只能在变量列表中进行提升,并从检查点重命名所选变量,但我真的不认为它是什么你需要在这里。

由于这是您模型的自定义图层,并且您在任何地方都没有此变量,只需在工作流程中初始化它,而不是尝试导入它。例如,您可以在调用函数fully_connected时传递此参数:

variables_to_restore = [v for v in variables if v.name.split('/')[0]!='boosting'] 
model_path = 'your/model/path'

saver = tf.train.Saver(variables_to_restore)

with tf.Session() as sess:
    saver.restore(sess, model_path)

您需要自己查看详细信息,因为我不确定您的导入是什么以及您在此处使用了哪些功能。

一般情况下,我建议您查看一下slim库,这样可以更轻松地为图层定义模型和范围(而不是定义它,您可以在调用时传递范围参数)一个功能)。它会看起来像苗条的那样:

weights_initializer = slim.variance_scaling_initializer()