根据另一个列表的索引将列表分成多个块

时间:2019-09-13 00:41:10

标签: python list indexing chunks

我想使用另一个列表的值作为要拆分的范围将一个列表拆分为多个块。

indices = [3, 5, 9, 13, 18]
my_list = ['a', 'b', 'c', ..., 'x', 'y', 'z']

因此,基本上,从范围中拆分my_list:

my_list[:3], mylist[3:5], my_list[5:9], my_list[9:13], my_list[13:18], my_list[18:]

我尝试将索引索引为2,但是结果不是我所需要的。

[indices[i:i + 2] for i in range(0, len(indices), 2)]

我的实际列表长度是1000。

3 个答案:

答案 0 :(得分:4)

您也可以使用简单的python来做到这一点。

数据

indices = [3, 5, 9, 13, 18]
my_list = list('abcdefghijklmnopqrstuvwxyz')

解决方案

使用列表理解。

[my_list[slice(ix,iy)] for ix, iy in zip([0]+indices, indices+[-1])]

输出

[['a', 'b', 'c'],
 ['d', 'e'],
 ['f', 'g', 'h', 'i'],
 ['j', 'k', 'l', 'm'],
 ['n', 'o', 'p', 'q', 'r'],
 ['s', 't', 'u', 'v', 'w', 'x', 'y']]

检查是否提取了正确的索引顺序

dict(((ix,iy), my_list[slice(ix,iy)]) for ix, iy in zip([0]+indices, indices+[-1]))

输出

{(0, 3): ['a', 'b', 'c'],
 (3, 5): ['d', 'e'],
 (5, 9): ['f', 'g', 'h', 'i'],
 (9, 13): ['j', 'k', 'l', 'm'],
 (13, 18): ['n', 'o', 'p', 'q', 'r'],
 (18, -1): ['s', 't', 'u', 'v', 'w', 'x', 'y']}

答案 1 :(得分:2)

使用itertools.teepairwise的一种方式:

from itertools import tee

def pairwise(iterable):
    "s -> (s0,s1), (s1,s2), (s2, s3), ..."
    a, b = tee(iterable)
    next(b, None)
    return zip(a, b)

chunks = [my_list[i:j] for i, j in pairwise([0, *indices, len(my_list)])]
print(chunks)

输出:

[['a', 'b', 'c'],
 ['d', 'e'],
 ['f', 'g', 'h', 'i'],
 ['j', 'k', 'l', 'm'],
 ['n', 'o', 'p', 'q', 'r'],
 ['s', 't', 'u', 'v', 'w', 'x', 'y', 'z']]

如果选择numpy,请使用numpy.array_split,这是为此目的

import numpy as np

np.array_split(my_list, indices)

输出:

[array(['a', 'b', 'c'], dtype='<U1'),
 array(['d', 'e'], dtype='<U1'),
 array(['f', 'g', 'h', 'i'], dtype='<U1'),
 array(['j', 'k', 'l', 'm'], dtype='<U1'),
 array(['n', 'o', 'p', 'q', 'r'], dtype='<U1'),
 array(['s', 't', 'u', 'v', 'w', 'x', 'y', 'z'], dtype='<U1')]

答案 2 :(得分:2)

可以使用itertools.zip_longest

[my_list[a:b] for a,b in it.zip_longest([0]+indices, indices)]

[['a', 'b', 'c'],
 ['d', 'e'],
 ['f', 'g', 'h', 'i'],
 ['j', 'k', 'l', 'm'],
 ['n', 'o', 'p', 'q', 'r'],
 ['s', 't', 'u', 'v', 'x', 'y', 'z']]

一些有趣的代码:

map(my_list.__getitem__, map(lambda s: slice(*s), it.zip_longest([0]+indices, indices)))