我有一个2D numpy数组我想找到所有独特元素的'every'位置。我们可以使用numpy.unique(numpyarray.)
找到唯一元素。这是棘手的部分。现在我必须知道每个独特元素的所有位置。让我们考虑以下示例。
array([[1, 1, 2, 2],\
[1, 1, 2, 2],\
[3, 3, 4, 4],\
[3, 3, 4, 4]])
结果应为
1, (0,0),(1,1)
2, (0,2),(1,2)
3, (2,0),(3,1)
4, (2,2),(3,3)
如何做到这一点以及什么是存储和迭代值的合适方式。
应注意,所有唯一值将彼此相邻。他们之间唯一的差距只能是零。让我们考虑另一种变体
array([[1, 0, 1, 2, 2],\
[1, 0, 1, 2, 2],\
[3, 0, 3, 4, 4],\
[3, 0, 3, 4, 4]])
结果应为
1, (0,0),(1,2)
2, (0,3),(1,4)
3, (2,0),(3,2)
4, (2,3),(3,4)
边界上的zeoros应该被忽略。
非常感谢
答案 0 :(得分:3)
这种简单,强力的方法就是使用numpy.where
。
例如,如果您只是想要边界框:
import numpy as np
x = np.array([[1,1,2,2],
[1,1,2,2],
[3,3,4,4],
[3,3,4,4]])
for val in np.unique(x):
rows, cols = np.where(x == val)
rowstart, rowstop = np.min(rows), np.max(rows)
colstart, colstop = np.min(cols), np.max(cols)
print val, (rowstart, colstart), (rowstop, colstop)
这也适用于带零的示例。
如果数组很大,并且您已经有scipy
,那么您可以考虑使用scipy.ndimage.find_objects
代替@unutbu建议。
在您的示例的特定情况下,您的唯一值是顺序整数,您可以直接使用find_objects
。它期望一个数组,其中除0以外的每个连续整数表示它需要返回其边界框的对象。 (完全按照您的意愿忽略0。)但是,通常,您需要进行一些预处理,以将任意唯一值转换为连续整数。
find_objects
返回slice
个对象的元组列表。老实说,这些可能正是你想要的,如果你想要的是bouding box。但是,打印开始和停止标记会显得更麻烦。
import numpy as np
import scipy.ndimage as ndimage
x = np.array([[1, 0, 1, 2, 2],
[1, 0, 1, 2, 2],
[3, 0, 3, 4, 4],
[3, 0, 3, 4, 4]])
for i, item in enumerate(ndimage.find_objects(x), start=1):
print i, item
这看起来会比您预期的略有不同。这些是slice
个对象,因此“max”值始终高于前一个示例中的“max”值。这样您就可以使用给定的元组进行切片以获取有问题的数据。
E.g。
for i, item in enumerate(ndimage.find_objects(x), start=1):
print i, ':'
print x[item], '\n'
如果你真的想要开始和停止,只需做这样的事情:
for i, (rowslice, colslice) in enumerate(ndimage.find_objects(x), start=1):
print i,
print (rowslice.start, rowslice.stop - 1),
print (colslice.start, colslice.stop - 1)
如果您的唯一值不是连续的整数,则需要进行一些预处理,如前所述。你可能会这样做:
import numpy as np
import scipy.ndimage as ndimage
x = np.array([[1.1, 0.0, 1.1, 0.9, 0.9],
[1.1, 0.0, 1.1, 0.9, 0.9],
[3.3, 0.0, 3.3, 4.4, 4.4],
[3.3, 0.0, 3.3, 4.4, 4.4]])
ignored_val = 0.0
labels = np.zeros(data.shape, dtype=np.int)
i = 1
for val in np.unique(x):
if val != ignored_val:
labels[x == val] = i
i += 1
# Now we can use the "labels" array as input to find_objects
for i, item in enumerate(ndimage.find_objects(labels), start=1):
print i, ':'
print x[item], '\n'