如何从numpy一维数组中的每N个元素中随机选择一个元素?
例如,我有一个numpy数组[1,2,3,4,5,6,7,8,9,10]
,我想每两个元素中随机选择一个元素。一个示例是[1,4,5,7,10]
,这意味着在1
中随机选择了[1,2]
,从4
中随机选择了[3,4]
,依此类推。
我试图重塑和改组数组,但找不到没有循环的优雅方法。
答案 0 :(得分:1)
对于可被窗口/组长度整除的长度,我们可以将其整形为2D数组,其长度为cols的数量,然后每行选择一个随机元素-
def random_pick(a, W):
b = a.reshape(-1,W)
idx = np.random.randint(0,b.shape[1], len(b))
return b[np.arange(len(idx)), idx]
样品运行-
In [17]: a
Out[17]: array([ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
In [18]: np.random.seed(0)
In [19]: random_pick(a, W=2)
Out[19]: array([ 1, 4, 6, 7, 10])
紧凑版本
这也可以翻译成更紧凑的版本-
In [81]: W = 2
In [82]: np.random.seed(0)
In [83]: a[np.random.randint(0,W,len(a)//W) + np.arange(0,len(a),W)]
Out[83]: array([ 1, 4, 6, 7, 10])
常规窗口长度
要使其通用,以便可以输入任何窗口长度,它将修改为-
def random_pick_generic(a, W):
L = W*(len(a)//W)
b = a[:L].reshape(-1,W)
idx = np.random.randint(0,b.shape[1], len(b))
out = b[np.arange(len(idx)), idx]
if len(a[L:])>0:
out = np.r_[out, np.random.choice(a[L:])]
return out
样品运行-
In [50]: a
Out[50]: array([ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
In [51]: np.random.seed(0)
In [52]: random_pick_generic(a, W=2)
Out[52]: array([ 1, 4, 6, 7, 10])
In [53]: np.random.seed(0)
In [54]: random_pick_generic(a, W=3)
Out[54]: array([ 1, 5, 7, 10])
扩展为3D
的情况:[batch_size,time_step,频道]
假设窗口长度为random_pick
的解决方案将修改为-
b = a.reshape(-1,a.shape[1]//W,W,a.shape[2])
idx = np.random.randint(0,b.shape[2], b.shape[1])
out = b[:,np.arange(len(idx)), idx]