我有两个numpy数组:
JAN-18 FEB-18 MAR-18
---------- ---------- ----------
42 11 99
我想将A与B进行比较,只将A中的值保持唯一-超出+/- 0.04的公差(即A = [3.8357])。
关于如何执行此操作的任何想法?
答案 0 :(得分:1)
方法1
我们可以使用broadcasting
-
A[(np.abs(np.subtract.outer(A,B)) > 0.04).all(1)]
方法2
我们可以利用searchsorted
来创建具有容错说明符的通用numpy.isin
,以便在通用问题中使用,例如-
def isin_tolerance(A, B, tol):
A = np.asarray(A)
B = np.asarray(B)
Bs = np.sort(B) # skip if already sorted
idx = np.searchsorted(Bs, A)
linvalid_mask = idx==len(B)
idx[linvalid_mask] = len(B)-1
lval = Bs[idx] - A
lval[linvalid_mask] *=-1
rinvalid_mask = idx==0
idx1 = idx-1
idx1[rinvalid_mask] = 0
rval = A - Bs[idx1]
rval[rinvalid_mask] *=-1
return np.minimum(lval, rval) <= tol
因此,要解决我们的问题-
out = A[~isin_tolerance(A, B, tol=0.04)]
样品运行-
In [294]: A
Out[294]: array([13.8357, 3.245 , 3.8357])
In [295]: B
Out[295]: array([5.6132, 3.2415, 3.6086, 3.5666, 3.8769, 4.3587])
In [296]: A[~isin_tolerance(A, B, tol=0.04)]
Out[296]: array([13.8357, 3.8357])