我有一个python列表,其中包含1000个。类似的东西:
data=["I","am","a","python","programmer".....]
其中,len(数据)=说1003
我现在想通过将原始列表拆分为100个块来创建此列表(数据)的子集。所以,最后,Id喜欢这样的内容:
data_chunk1=[.....] #first 100 items of list data
data_chunk2=[.....] #second 100 items of list data
.
.
.
data_chunk11=[.....] # remainder of the entries,& its len <=100, len(data_chunk_11)=3
有没有pythonic方法来完成这项任务?显然我可以使用数据[0:100]等等,但我认为这非常非pythonic且非常低效。
非常感谢。
答案 0 :(得分:276)
我会说
chunks = [data[x:x+100] for x in range(0, len(data), 100)]
如果您使用的是python 2.x而不是3.x,那么使用xrange()
将上述代码更改为:
chunks = [data[x:x+100] for x in xrange(0, len(data), 100)]
答案 1 :(得分:29)
实际上我认为在这种情况下使用普通切片是最好的解决方案:
for i in range(0, len(data), 100):
chunk = data[i:i + 100]
...
如果您想避免复制切片,可以使用itertools.islice()
,但这里似乎没有必要。
itertools()
文档还包含着名的“石斑鱼”模式:
def grouper(n, iterable, fillvalue=None):
"grouper(3, 'ABCDEFG', 'x') --> ABC DEF Gxx"
args = [iter(iterable)] * n
return izip_longest(fillvalue=fillvalue, *args)
您需要修改它以正确处理最后一个块,所以我认为使用普通切片的直接解决方案更可取。
答案 2 :(得分:8)
chunks = [data[100*i:100*(i+1)] for i in range(len(data)/100 + 1)]
这相当于接受的答案。例如,为了便于阅读,缩短为10批次:
data = range(35)
print [data[x:x+10] for x in xrange(0, len(data), 10)]
print [data[10*i:10*(i+1)] for i in range(len(data)/10 + 1)]
输出:
[[0, 1, 2, 3, 4, 5, 6, 7, 8, 9], [10, 11, 12, 13, 14, 15, 16, 17, 18, 19], [20, 21, 22, 23, 24, 25, 26, 27, 28, 29], [30, 31, 32, 33, 34]]
[[0, 1, 2, 3, 4, 5, 6, 7, 8, 9], [10, 11, 12, 13, 14, 15, 16, 17, 18, 19], [20, 21, 22, 23, 24, 25, 26, 27, 28, 29], [30, 31, 32, 33, 34]]