尽管I set the seeds,但我目前存在再现性问题。我知道模型是用相同的方式初始化的(通过检查model.save("initial.h5")
和h5dump
并进行融合)。
接下来我要检查一下训练样本是否以相同的顺序使用。因此,我想记录它们。
我通过
model.fit(dataset['train']['X'],
dataset['train']['y'],
epochs=cfg['model']['nb_epochs'],
batch_size=cfg['model']['batch_size'],
validation_split=cfg['model']['validation_split'],
callbacks=[checkpoint], class_weight=cw)
我还可以添加dataset['train']['id']
。我想获取一个包含正在使用的ID列表的txt文件,例如对于32的批量大小,训练数据集的长度为765和5个时期,我希望txt文件中的765 * 5 = 3825行,其中每个ID大约出现5次,而前32个元素是第一个批次的ID。
有可能吗?