我有一个100k条目的列表,并希望将它们分成10k混洗批次。怎么做?
我在sklearn
中找到了一个shuffle函数,其参数为n_samples
。但是我没有看到任何保证,这批将涵盖所有设置。
我想从整个集合中随机批量但不重复它们直到所有样本都被采集。这可能吗?
答案 0 :(得分:2)
你的意思是:
from random import shuffle
def batches(entries):
shuffle(entries)
for i in range(0, len(entries), 10000):
yield entries[i:i+10000]