Question

我使用numpy数组来保存有序对的列表（表示网格坐标）。我正在编写的算法需要检查新生成的有序对是否已经在此数组中。下面是代码示意图：

cluster=np.array([[x1,y1]])
cluster=np.append(cluster,[[x2,y2]],axis=0)
cluster=np.append...etc.

new_spin=np.array([[x,y]])

if new_spin in cluster==False:
    do something

这个当前代码的问题在于它会产生误报。如果x或y出现在群集中，则new_spin in cluster的计算结果为true。起初我认为一个简单的解决方法是询问x和y是否出现在cluster中，但这并不能确保它们显示为有序对。为了确保它们显示为有序对，我必须找到x和y出现在cluster中的索引并进行比较，这看起来非常笨重和不优雅，而且我我必须有一个更好的解决方案。但是，我自己无法解决这个问题。

感谢您的帮助。

Answer 1

让我们来看一个例子：

In [7]: import numpy as np
In [8]: cluster = np.random.randint(10, size = (5,2))
In [9]: cluster
Out[9]: 
array([[9, 7],
       [7, 2],
       [8, 9],
       [1, 3],
       [3, 4]])

In [10]: new_spin = np.array([[1,2]])

In [11]: new_spin == cluster
Out[11]: 
array([[False, False],
       [False,  True],
       [False, False],
       [ True, False],
       [False, False]], dtype=bool)

new_spin == cluster是dtype bool的numpy数组。如果cluster中的值等于new_spin中的对应值，则为True。

要使new_spin“在”cluster中，上述布尔数组的行必须全部为True。我们可以通过调用all(axis = 1)方法找到这样的行：

In [12]: (new_spin == cluster).all(axis = 1)
Out[12]: array([False, False, False, False, False], dtype=bool)

所以new_spin“在”cluster中，如果行的any全部为True：

In [13]: 
In [14]: (new_spin == cluster).all(axis = 1).any()
Out[14]: False

顺便说一下，np.append是一个非常慢的操作 - 比Python list.append慢。如果你避免np.append，你可能会获得更好的表现。如果cluster不是太大，那么最好使群集成为Python列表 - 至少在你完成附加项目之前。然后，如果需要，将cluster转换为带有cluster = np.array(cluster)的numpy数组。

检测numpy数组中的有序对

1 个答案: