我已经使用tf.data.Dataset
API训练了模型,所以我的训练代码看起来像这样
with graph.as_default():
dataset = tf.data.TFRecordDataset(tfrecord_path)
dataset = dataset.map(scale_features, num_parallel_calls=n_workers)
dataset = dataset.shuffle(10000)
dataset = dataset.padded_batch(batch_size, padded_shapes={...})
handle = tf.placeholder(tf.string, shape=[])
iterator = tf.data.Iterator.from_string_handle(handle,
train_dataset.output_types,
train_dataset.output_shapes)
batch = iterator.get_next()
...
# Model code
...
iterator = dataset.make_initializable_iterator()
with tf.Session(graph=graph) as sess:
train_handle = sess.run(iterator.string_handle())
sess.run(tf.global_variables_initializer())
for epoch in range(n_epochs):
sess.run(train_iterator.initializer)
while True:
try:
sess.run(optimizer, feed_dict={handle: train_handle})
except tf.errors.OutOfRangeError:
break
现在,在训练模型之后,我想推断出数据集中没有的示例,而且我不确定该怎么做。
请清楚一点,我知道如何使用另一个数据集,例如,我只是在测试时将句柄传递给测试集。
问题是关于给定的缩放方案以及网络需要一个句柄这一事实,如果我要对未写入TFRecord的新示例进行预测,我将如何去做?
如果我要修改batch
,我将负责缩放,这是我希望避免的事情。
那么我应该如何从模型中推导tf.data.Dataset
方式的单个示例?
(这不是出于生产目的,而是用于评估如果我更改特定功能会发生什么情况)
答案 0 :(得分:3)
实际上图中有一个名为“ IteratorGetNext:0”的张量名称 使用数据集api时,可以使用以下方式直接设置 输入:
#get a tensor from a graph
input tensor : input = graph.get_tensor_by_name("IteratorGetNext:0")
# difine the target tensor you want evaluate for your prediction
prediction tensor: predictions=...
# finally call session to run
then sess.run(predictions, feed_dict={input: np.asanyarray(images), ...})