给定一个整数计数数组c
,如何将其转换为整数数组inds
,使np.all(np.bincount(inds) == c)
为真?
例如:
>>> c = np.array([1,3,2,2])
>>> inverse_bincount(c) # <-- what I need
array([0,1,1,1,2,2,3,3])
背景信息:我尝试跟踪多组数据的位置,同时对所有数据进行计算。我将所有数据连接在一起进行批处理,但我需要一个索引数组来提取结果。
目前的解决方法:
def inverse_bincount(c):
return np.array(list(chain.from_iterable([i]*n for i,n in enumerate(c))))
答案 0 :(得分:11)
使用numpy.repeat
:
np.repeat(np.arange(c.size), c)
答案 1 :(得分:1)
不需要numpy:
c = [1,3,2,2]
reduce(lambda x,y: x + [y] * c[y], range(len(c)), [])
答案 2 :(得分:1)
以下在我的机器上的速度是目前接受答案的两倍;虽然我必须说我对np.repeat的表现感到惊讶。我希望它可以从临时对象创建中受到很大影响,但它确实很好。
import numpy as np
c = np.array([1,3,2,2])
p = np.cumsum(c)
i = np.zeros(p[-1],np.int)
np.add.at(i, p[:-1], 1)
print np.cumsum(i)