应用错误收集

我为张量流的自定义估计器实现了input_fn。

数据量少，因此需要应用数据扩充。我这样做了，但是如果我想对同一数据集进行数据扩充，改组，重复和批处理，我不知道在对数据集执行操作顺序方面最好的做法。

在TensorFlow官方网页上，关于输入管道的性能，他们建议在重复数据集之前先进行随机播放，例如使用统一方法tf.contrib.data.shuffle_and_repeat。

正确的操作顺序是什么？

1-加载数据集

2-应用数据增强

3-随机播放并重复

4-批次

5-预取

这是“适当”的命令吗？还是应该将步骤2和3互换？

我找不到有关步骤2和3的顺序的特定信息。