python成对地减去由向量组成的多维数组中的两个元素

时间:2018-02-22 19:13:22

标签: python numpy multidimensional-array scipy subtraction

我想知道是否有非常简单的方法来计算多维数组中两个元素的成对减法,该数组由使用NUMPY或SCIPY库中的函数的向量组成。

让我举一个例子:

>>> a = (np.arange(9)).reshape((3,3)) # a list of 3 vectors (x, y, z)

>>> a
array([[0, 1, 2],
       [3, 4, 5],
       [6, 7, 8]])

我想得到以下内容:

>>>> result
array([[3,3,3],
       [6,6,6],
       [3,3,3]])
# first element comes from [3,4,5] - [0,1,2]
# second element comes from [6,7,8] - [0,1,2]
# third element comes from [6,7,8] - [3,4,5]

我对结果的符号(+/-)无关紧要,这取决于两个向量的减法顺序。 但是,我想知道使用Scipy或Numpy库(如scipy.spatial.distance.pdist)中预定义函数的非常简单的代码版本。

我确实需要循环代码来迭代元素 - 结果, 相反,我只需要一行来获得结果。

2 个答案:

答案 0 :(得分:3)

方法#1

使用np.triu_indices获取成对索引,使用a的行索引并计算差异 -

In [8]: r,c = np.triu_indices(len(a),1)

In [9]: a[c] - a[r]
Out[9]: 
array([[3, 3, 3],
       [6, 6, 6],
       [3, 3, 3]])

方法#2

我们还可以使用切片来避免创建索引和索引部分本身,它为减法所需的切片创建输入数组的副本。因此,我们只使用视图,但我们需要在该过程中进行迭代。切片的优势在于显示大型阵列的性能,我们稍后会在时间上进行验证。实施将是 -

n = len(a)
N = n*(n-1)//2
idx = np.concatenate(( [0], np.arange(n-1,0,-1).cumsum() ))
start, stop = idx[:-1], idx[1:]
out = np.empty((N,a.shape[1]),dtype=a.dtype)
for j,i in enumerate(range(n-1)):
    out[start[j]:stop[j]] = a[i+1:] - a[i,None]

运行时测试

作为funcs的方法 -

def pairwise_row_diff_triu_indices(a):
    r,c = np.triu_indices(len(a),1)
    out = a[c] - a[r]
    return out

def pairwise_row_diff_slicing(a):
    n = len(a)
    N = n*(n-1)//2
    idx = np.concatenate(( [0], np.arange(n-1,0,-1).cumsum() ))
    start, stop = idx[:-1], idx[1:]
    out = np.empty((N,a.shape[1]),dtype=a.dtype)
    for j,i in enumerate(range(n-1)):
        out[start[j]:stop[j]] = a[i+1:] - a[i,None]
    return out

计时 -

In [53]: np.random.seed(0)

In [54]: a = np.random.randint(0,9,(1000,3))

In [55]: %timeit pairwise_row_diff_triu_indices(a)
    ...: %timeit pairwise_row_diff_slicing(a)
10 loops, best of 3: 21 ms per loop
100 loops, best of 3: 6.01 ms per loop

In [56]: a = np.random.randint(0,9,(5000,3))

In [57]: %timeit pairwise_row_diff_triu_indices(a)
    ...: %timeit pairwise_row_diff_slicing(a)
1 loop, best of 3: 456 ms per loop
10 loops, best of 3: 110 ms per loop

答案 1 :(得分:0)

这不是使用numpy或scipy函数......但它是一个简单的解决方案

  <input type="text" name="EMAIL" value="[shortcode_here]" required />
<input type="submit" value="Submit" />