以这个answer为例。 Dataset.shuffle
如何改组Dataset
对象,即数组
["filename_00001.jpg", "filename_00002.jpg", ...,
"filename_10001.jpg", "filename_10002.jpg", ...]
。
根据shuffle
document,buffer_size表示此数据集中要从中采样新数据集的元素数。因此,如果说我们为上述示例设置了buffer_size = 1000
,那么从
["filename_00001.jpg",..., "filename_01000.jpg"]
中采样第一个小批量,然后如何采样第二个小批量?如果batch_size>buffer_size
,那么
Dataset.shuffle(buffer_size).repeat().batch(batch_size)
如何精确地进行小批量采样?