标签: python tensorflow deep-learning lstm pre-trained-model
以下是我想做的事情:
我想使用一些转移学习技术来处理序列问题: 首先使用dataset_1训练一个lstm模型, 第二个在输出层之前插入另一个lstm层, 然后使用dataset_2仅训练新添加的图层,其他图层的变量从第一个训练阶段导入并保持不变
这就是问题,现有方法在恢复预训练模型时都需要变量名称的重量/偏差。我想在我的code中使用函数tf.contrib.rnn.MultiRNNCell(*)。但是,该函数是一个黑盒子,无法获取具体的变量名称。我怎么能实现这个想法?
tf.contrib.rnn.MultiRNNCell(*)