对于每个标题,我想找到一种方法来应用影响一批输入数据内容的函数,同时尽可能地保留由...提供的并行/速度效率tf.data API。
例如,假设我的输入是KxK图像,并且我只想选择其像素的一小部分,从而得到MxM图像。此外,我希望该分数是预定义范围内的随机数,这在批图像中将至关重要地。
我如何(可以?)以允许预取多个批次并使用数据集.map函数的num_parallel_calls参数提供的真实并发性的方式进行此操作?
PS。在获取之前天真地在会话中调用tf.random_uniform来设置 parse_function 的控制参数,我认为这完全破坏了并行化/预取。
PS2。依靠预计算/存储cpu-global变量中的随机分数并存储在全状态 parse_function 内的解决方案是“ OK”,但我希望有更好的方法,因为这样的解决方案将不得不依靠固定的批次大小。