Tensorflow输入管道操作顺序最佳实践

时间:2019-05-07 15:33:09

标签: python tensorflow tensorflow-datasets

我为张量流的自定义估计器实现了input_fn。

数据量少,因此需要应用数据扩充。我这样做了,但是如果我想对同一数据集进行数据扩充,改组,重复和批处理,我不知道在对数据集执行操作顺序方面最好的做法。

在TensorFlow官方网页上,关于输入管道的性能,他们建议在重复数据集之前先进行随机播放,例如使用统一方法tf.contrib.data.shuffle_and_repeat

正确的操作顺序是什么?

1-加载数据集

2-应用数据增强

3-随机播放并重复

4-批次

5-预取

这是“适当”的命令吗?还是应该将步骤2和3互换?

我找不到有关步骤2和3的顺序的特定信息。

0 个答案:

没有答案