在numpy数组的每N个元素中随机选择一个元素

时间:2020-08-28 08:43:20

标签: python arrays numpy

如何从numpy一维数组中的每N个元素中随机选择一个元素?

例如,我有一个numpy数组[1,2,3,4,5,6,7,8,9,10],我想每两个元素中随机选择一个元素。一个示例是[1,4,5,7,10],这意味着在1中随机选择了[1,2],从4中随机选择了[3,4],依此类推。

我试图重塑和改组数组,但找不到没有循环的优雅方法。

1 个答案:

答案 0 :(得分:1)

对于可被窗口/组长度整除的长度,我们可以将其整形为2D数组,其长度为cols的数量,然后每行选择一个随机元素-

def random_pick(a, W):
    b = a.reshape(-1,W)
    idx = np.random.randint(0,b.shape[1], len(b))
    return b[np.arange(len(idx)), idx]

样品运行-

In [17]: a
Out[17]: array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10])

In [18]: np.random.seed(0)

In [19]: random_pick(a, W=2)
Out[19]: array([ 1,  4,  6,  7, 10])

紧凑版本

这也可以翻译成更紧凑的版本-

In [81]: W = 2

In [82]: np.random.seed(0)

In [83]: a[np.random.randint(0,W,len(a)//W) + np.arange(0,len(a),W)]
Out[83]: array([ 1,  4,  6,  7, 10])

常规窗口长度

要使其通用,以便可以输入任何窗口长度,它将修改为-

def random_pick_generic(a, W):
    L = W*(len(a)//W)
    b = a[:L].reshape(-1,W)
    idx = np.random.randint(0,b.shape[1], len(b))
    out = b[np.arange(len(idx)), idx]
    if len(a[L:])>0:
        out = np.r_[out, np.random.choice(a[L:])]
    return out

样品运行-

In [50]: a
Out[50]: array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10])

In [51]: np.random.seed(0)

In [52]: random_pick_generic(a, W=2)
Out[52]: array([ 1,  4,  6,  7, 10])

In [53]: np.random.seed(0)

In [54]: random_pick_generic(a, W=3)
Out[54]: array([ 1,  5,  7, 10])

扩展为3D的情况:[batch_size,time_step,频道]

假设窗口长度为random_pick的解决方案将修改为-

b = a.reshape(-1,a.shape[1]//W,W,a.shape[2])
idx = np.random.randint(0,b.shape[2], b.shape[1])
out = b[:,np.arange(len(idx)), idx]