我想使用tf.estimator.Estimator
来管理我的培训,但在使用tf.data
API时遇到一些麻烦。
我有这样的事情:
def model_fn(features, labels, params, mode):
# Defines model's ops.
# Initializes with tf.train.Scaffold.
# Returns an tf.estimator.EstimatorSpec.
def input_fn():
dataset = tf.data.TextLineDataset("test.txt")
# map, shuffle, padded_batch, etc.
iterator = dataset.make_initializable_iterator()
return iterator.get_next()
estimator = tf.estimator.Estimator(model_fn)
estimator.train(input_fn)
由于我无法使用make_one_shot_iterator
作为我的用例,我的问题是input_fn
包含一个应该在model_fn
内初始化的迭代器(这里,我使用{ {3}}初始化本地操作。)
此外,我了解我们不能仅使用input_fn = iterator.get_next
,否则其他操作不会添加到同一图表中。
初始化迭代器的推荐方法是什么?
答案 0 :(得分:13)
从TensorFlow 1.5开始,可以使input_fn
返回tf.data.Dataset
,例如:
def input_fn():
dataset = tf.data.TextLineDataset("test.txt")
# map, shuffle, padded_batch, etc.
return dataset
请参阅c294fcfd。
对于以前的版本,您可以在tf.GraphKeys.TABLE_INITIALIZERS
集合中添加迭代器的初始值设定项,并依赖于默认初始值设定项。
tf.add_to_collection(tf.GraphKeys.TABLE_INITIALIZERS, iterator.initializer)