具有公差的NumPy setdiff1d-将numpy数组与另一个数组进行比较,并且仅保存唯一值-超出公差

时间:2018-08-08 10:39:49

标签: python arrays python-3.x numpy

我有两个numpy数组:

    JAN-18     FEB-18     MAR-18
---------- ---------- ----------
        42         11         99

我想将A与B进行比较,只将A中的值保持唯一-超出+/- 0.04的公差(即A = [3.8357])。

关于如何执行此操作的任何想法?

1 个答案:

答案 0 :(得分:1)

方法1

我们可以使用broadcasting-

A[(np.abs(np.subtract.outer(A,B)) > 0.04).all(1)]

方法2

我们可以利用searchsorted来创建具有容错说明符的通用numpy.isin,以便在通用问题中使用,例如-

def isin_tolerance(A, B, tol):
    A = np.asarray(A)
    B = np.asarray(B)

    Bs = np.sort(B) # skip if already sorted
    idx = np.searchsorted(Bs, A)

    linvalid_mask = idx==len(B)
    idx[linvalid_mask] = len(B)-1
    lval = Bs[idx] - A
    lval[linvalid_mask] *=-1

    rinvalid_mask = idx==0
    idx1 = idx-1
    idx1[rinvalid_mask] = 0
    rval = A - Bs[idx1]
    rval[rinvalid_mask] *=-1
    return np.minimum(lval, rval) <= tol

因此,要解决我们的问题-

out = A[~isin_tolerance(A, B, tol=0.04)]

样品运行-

In [294]: A
Out[294]: array([13.8357,  3.245 ,  3.8357])

In [295]: B
Out[295]: array([5.6132, 3.2415, 3.6086, 3.5666, 3.8769, 4.3587])

In [296]: A[~isin_tolerance(A, B, tol=0.04)]
Out[296]: array([13.8357,  3.8357])