我为张量流的自定义估计器实现了input_fn。
数据量少,因此需要应用数据扩充。我这样做了,但是如果我想对同一数据集进行数据扩充,改组,重复和批处理,我不知道在对数据集执行操作顺序方面最好的做法。
在TensorFlow官方网页上,关于输入管道的性能,他们建议在重复数据集之前先进行随机播放,例如使用统一方法tf.contrib.data.shuffle_and_repeat
。
正确的操作顺序是什么?
1-加载数据集
2-应用数据增强
3-随机播放并重复
4-批次
5-预取
这是“适当”的命令吗?还是应该将步骤2和3互换?
我找不到有关步骤2和3的顺序的特定信息。