shuffle_size()到底如何影响tensorflow.Data.shuffle方法的采样及其与batch_size的关系

时间:2018-07-11 02:27:57

标签: python tensorflow tensorflow-datasets

以这个answer为例。 Dataset.shuffle如何改组Dataset对象,即数组 ["filename_00001.jpg", "filename_00002.jpg", ..., "filename_10001.jpg", "filename_10002.jpg", ...]

根据shuffle document,buffer_size表示此数据集中要从中采样新数据集的元素数。因此,如果说我们为上述示例设置了buffer_size = 1000,那么从 ["filename_00001.jpg",..., "filename_01000.jpg"]中采样第一个小批量,然后如何采样第二个小批量?如果batch_size>buffer_size,那么 Dataset.shuffle(buffer_size).repeat().batch(batch_size)如何精确地进行小批量采样?

0 个答案:

没有答案