检测numpy数组中的有序对

时间:2012-12-15 02:54:53

标签: python numpy

我使用numpy数组来保存有序对的列表(表示网格坐标)。我正在编写的算法需要检查新生成的有序对是否已经在此数组中。下面是代码示意图:

cluster=np.array([[x1,y1]])
cluster=np.append(cluster,[[x2,y2]],axis=0)
cluster=np.append...etc.

new_spin=np.array([[x,y]])

if new_spin in cluster==False:
    do something

这个当前代码的问题在于它会产生误报。如果x或y出现在群集中,则new_spin in cluster的计算结果为true。起初我认为一个简单的解决方法是询问xy是否出现在cluster中,但这并不能确保它们显示为有序对。为了确保它们显示为有序对,我必须找到xy出现在cluster中的索引并进行比较,这看起来非常笨重和不优雅,而且我我必须有一个更好的解决方案。但是,我自己无法解决这个问题。

感谢您的帮助。

1 个答案:

答案 0 :(得分:4)

让我们来看一个例子:

In [7]: import numpy as np
In [8]: cluster = np.random.randint(10, size = (5,2))
In [9]: cluster
Out[9]: 
array([[9, 7],
       [7, 2],
       [8, 9],
       [1, 3],
       [3, 4]])

In [10]: new_spin = np.array([[1,2]])

In [11]: new_spin == cluster
Out[11]: 
array([[False, False],
       [False,  True],
       [False, False],
       [ True, False],
       [False, False]], dtype=bool)

new_spin == cluster是dtype bool的numpy数组。如果cluster中的值等于new_spin中的对应值,则为True。

要使new_spin“在”cluster中,上述布尔数组的必须全部为True。我们可以通过调用all(axis = 1)方法找到这样的行:

In [12]: (new_spin == cluster).all(axis = 1)
Out[12]: array([False, False, False, False, False], dtype=bool)

所以new_spin“在”cluster中,如果行的any全部为True:

In [13]: 
In [14]: (new_spin == cluster).all(axis = 1).any()
Out[14]: False

顺便说一下,np.append是一个非常慢的操作 - 比Python list.append慢。如果你避免np.append,你可能会获得更好的表现。如果cluster不是太大,那么最好使群集成为Python列表 - 至少在你完成附加项目之前。然后,如果需要,将cluster转换为带有cluster = np.array(cluster)的numpy数组。