我有一个复数列表,我希望在另一个复数列表中找到最接近的值。
目前使用numpy的方法:
async function foo() {
const result = await bar(); // is this await required?
console.log(result);
}
async function bar() {
console.log('waiting...');
return await new Promise(resolve => setTimeout(() => resolve('result'), 1000)) ;
}
不幸的是,这需要很长时间才能获得大量值。 是否有更快或更多的蟒蛇"将myArray中的每个值与refArray中最接近的值匹配的方法?
仅供参考:我的剧本中不一定需要numpy。
重要提示: myArray和refArray的顺序很重要,不应更改。如果要应用排序,则应以某种方式保留原始索引。
答案 0 :(得分:9)
这是基于np.searchsorted
-
this post
的一种矢量化方法
def closest_argmin(A, B):
L = B.size
sidx_B = B.argsort()
sorted_B = B[sidx_B]
sorted_idx = np.searchsorted(sorted_B, A)
sorted_idx[sorted_idx==L] = L-1
mask = (sorted_idx > 0) & \
((np.abs(A - sorted_B[sorted_idx-1]) < np.abs(A - sorted_B[sorted_idx])) )
return sidx_B[sorted_idx-mask]
简要说明:
获取左侧位置的排序索引。我们使用 - np.searchsorted(arr1, arr2, side='left')
或np.searchsorted(arr1, arr2)
执行此操作。现在,searchsorted
期望排序数组作为第一个输入,所以我们需要在那里进行一些准备工作。
将这些左侧位置的值与其右侧位置(left + 1)
的值进行比较,看看哪一个最接近。我们在计算mask
的步骤中执行此操作。
根据左边的或右边的最近的,选择相应的。这是通过减去索引来完成的,mask
值作为偏移量转换为ints
。
<强>基准强>
原创方法 -
def org_app(myArray, refArray):
out1 = np.empty(myArray.size, dtype=int)
for i, value in enumerate(myArray):
# find_nearest from posted question
index = find_nearest(refArray, value)
out1[i] = index
return out1
计时和验证 -
In [188]: refArray = np.random.random(16)
...: myArray = np.random.random(1000)
...:
In [189]: %timeit org_app(myArray, refArray)
100 loops, best of 3: 1.95 ms per loop
In [190]: %timeit closest_argmin(myArray, refArray)
10000 loops, best of 3: 36.6 µs per loop
In [191]: np.allclose(closest_argmin(myArray, refArray), org_app(myArray, refArray))
Out[191]: True
发布的样本 50x+
加速,希望更大的数据集更多!
答案 1 :(得分:0)
比@Divakar短得多的答案,还使用广播甚至更快:
abs(myArray[:, None] - refArray[None, :]).argmin(axis=-1)