我已经看到,现在tf.contrib.data.sample_from_datasets()可以根据给定的概率分布从不同的数据集中进行采样。但是,我对在单个数据集中的随机数据块采样感兴趣。
此刻,我正在使用tf.data
迭代器,并且正在使用np.random.choice()的生成器对其进行初始化,以生成要采样的块的第一个索引,如{{1 }}接受自定义概率分布作为输入。这种方法很笨重,我认为如果我在所有步骤中都可以使用tensorflow的数据集,那么它的速度就不会那么快。
是否有已知的方法来实现这一目标?