使用带有索引的np.where

时间:2019-05-17 09:33:09

标签: python performance numpy

我有一个零数组(17520,5),我想用两个值填充:0和0.05。我有两个条件,并且正在使用函数np.where,但是,我只需要在数组的特定索引处应用第二个条件。我使用的代码如下:

independent = np.zeros([17520,5])
w1 = np.where(independent == 0)
independent[w1] = np.random.choice([0.0, 0.05], size=len(w1[0]))

这部分代码可以正常工作,并用所需的值(0和0.05)以相同的比例(50/50)填充零数组(独立)。另一方面,第二个条件仅需要在特定的索引处实现,如下所示:

for n in range(0, 365):
    start = 24 + n*48
    end = 46 + n*48
    w2 = np.where(independent == 0.05)
    independent[w2][start:end,0:5]=np.random.choice([0.0, 0.05], (22,5),size=len(w2[0]))

[start:end,0:5]表示我要实现条件w2的索引。

感谢您的帮助,指出了将np.where函数与索引一起使用的正确方法,因为目前我遇到以下错误

 SyntaxError: invalid syntax

1 个答案:

答案 0 :(得分:1)

请注意,np.where也可以接受两个 array_like 参数,具体取决于条件。在您的情况下,如何使用np.where

for n in range(0, 365):
    start = 24 + n*48
    end = 46 + n*48
    independent[start:end,0:5] = (np.where(independent== 0.05, 
                                          np.random.choice([0.0, 0.05], 
                                                    size=independent.shape), 
                                          independent)[start:end,0:5])

这有点棘手,但是上面可以进行矢量化处理。关键是获得要更新independent的范围的列表。为此,我们可以从链接的答案中使用n_ranges,该答案可用于获得一个平面数组,该数组的范围从相应的startend

start = 24 + np.arange(0, 365)*48
end = 46 + np.arange(0, 365)*48
ranges = n_ranges(start, end)
independent[ranges,0:5] = (np.where(independent== 0.05, 
                                   np.random.choice([0.0, 0.05], 
                                                    size=independent.shape), 
                                   independent)[ranges,0:5])

检查时间,我们可以看到,通过第二种方法,我们获得了 260x 加速!

def vect_approach(a):
    start = 24 + np.arange(0, 365)*48
    end = 46 + np.arange(0, 365)*48
    ranges = n_ranges(start, end)
    a[ranges,0:5] = (np.where(a== 0.05, 
                             np.random.choice([0.0, 0.05], size=a.shape ),
                             a)[ranges,0:5])

def loopy_approach(x):
    for n in range(0, 365):
        start = 24 + n*48
        end = 46 + n*48
        independent[start:end,0:5] = (np.where(independent== 0.05, 
                                              np.random.choice([0.0, 0.05], 
                                                        size=independent.shape), 
                                              independent)[start:end,0:5])

independent = np.zeros([17520,5])

%timeit loopy_approach(independent)
# 475 ms ± 19.3 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
%timeit vect_approach(independent)
# 1.87 ms ± 95.4 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)