我试图找到一种创建此类列表的更快方法:
import numpy as np
values = [0,1,2]
repeat = [3,4,2]
list = np.empty(0, dtype=int)
for i in range(len(values)):
list = np.append(list, np.full(repeat[i], values[i]))
print list
返回
[0 0 0 1 1 1 1 2 2]
有什么主意吗?谢谢
答案 0 :(得分:0)
您可以使用本机python列表而不是numpy数组节省大量时间。当我使用timeit
模块运行您的代码时,花了16.87秒。以下代码的代码为0.87。
list = []
for val, rep in zip(values, repeat):
list.extend([val]*rep)
如果您随后使用list = np.array(list)
将列表转换为numpy数组,则该时间最多为2.09秒。
当然,由于numpy is optimized for large amounts of data,这可能不适用于包含大量重复的非常长的值列表。在这种情况下,一种替代方法是同时进行所有内存分配,而不是连续加长数组(我相信covertly causes a copy to made会很慢)。下面的示例在4.44秒内完成。
list = np.empty(sum(repeat), dtype=int) #allocate the full length
i=0 #start the index at 0
for val, rep in zip (values, repeat):
list[i:i+rep] = [val]*rep #replace the slice
i+=rep #update the index
答案 1 :(得分:0)
您可以尝试一下。对于每对值和长度,将值列表乘以长度。
您将获得列表列表
L = [[i]*j for i, j in zip(values, repeat)]
print(L)
返回
[[0, 0, 0], [1, 1, 1, 1], [2, 2]]
比作一个简单的清单
flat_L = [item for sublist in L for item in sublist]
print(flat_L)
[0, 0, 0, 1, 1, 1, 1, 2, 2]
答案 2 :(得分:0)
我会这样:
a=[1,2,3]
b=[2,4,3]
x=[[y]*cnt_b for cnt_b,y in zip(b,a)]
输出:
[[1,1],[2,2,2,2],[3,3,3]]
答案 3 :(得分:0)
In [8]: [i for i, j in zip(values, repeat) for _ in range(j)]
Out[8]: [0, 0, 0, 1, 1, 1, 1, 2, 2]
在这里,我们正在压缩值,并与zip一起重复以使它们之间具有一对一的对应关系(例如[(0,3),(1,4),(2,2)])。现在,在列表理解中,我将插入i或值,并在j的范围内循环以将其重复j次。