我在我的数据上运行k-means算法,我的标签输出如下所示:
[0 5 8 6 1 3 3 2 2 5 5 6 1 1 3 3 1 8 8 3 3 1 1 1 1 5 2 5 1 1 7 3 6 4 3 3 8
1 3 3 5 1 8 8 1 8 7 1 1 8 6]
此向量包含点索引的簇编号,例如,第一个值为cluster no。 0表示点索引0,向量的第二个值表示它的簇号为0。 5,点指数1属于它。
我想拥有群集的子集: 像:
cluster no 0 = { its index numbers}
cluster no 1 = { its index numbers}
..
cluster no 8 = { its index numbers}
例如,向量的第一个值为5,我需要列出该向量的所有索引,其值为5,反之亦然。我希望每个值都有自己的索引列表。
所以Value 5的列表应该是:
第5组= [1,9,10,25,27 ....
和其他值的所有输出,最终输出应该是8个列表。
答案 0 :(得分:1)
如果你愿意使用numpy,这很容易用numpy.where
完成cluster5, = numpy.where( array == 5 )
纯粹的' python你可以这样做:
cluster5 = [i for i in range(len(array)) if array[i]==5]
答案 1 :(得分:0)
这将使用enumerate:
来解决问题array = [0,5,8,6,1,3,3,2,2,5,5,6,1,1,3,3,1,8,8,3,3,1,1,1,1,5,2,5,1,1,7,3,6,4,3,3,8,1,3,3,5,1,8,8,1,8,7,1,1,8,6]
for j in range(9):
print("%i: %s"%(j,[i for i,x in enumerate(array) if x == j]))
答案 2 :(得分:0)
def cluster(seq):
out = {}
for index, value in enumerate(seq):
try:
out[value].append(index)
except KeyError:
out[value] = [index]
return out
data = [2, 3, 4, 4, 3, 1]
result = cluster(data)
assert result[2] == [0]
assert result[3] == [1, 4]
assert result[4] == [2, 3]
assert result[1] == [5]