从索引对创建倍数的元组

时间:2018-07-10 11:16:05

标签: python arrays numpy tuples pairwise

给出一个numpy数组,该数组可以是满足给定条件的数组元素的索引的子集。如何从结果索引对中创建三元组(或四元组,五元组……)的元组?

在下面的示例中,pairs_tuples等于[(1,0),(3,0),(3,1),(3,2)]。 triplets_tuples应该为[(0,1,3)],因为其所有元素(即(1,0),(3,0),(3,1))的成对值都满足条件,而(3,2)才不是。

a = np.array([[0.        , 0.        , 0.        , 0.        , 0.      ],
              [0.96078379, 0.        , 0.        , 0.        , 0.      ],
              [0.05498203, 0.0552454 , 0.        , 0.        , 0.      ],
              [0.46005028, 0.45468466, 0.11167813, 0.        , 0.      ],
              [0.1030161 , 0.10350956, 0.00109096, 0.00928037, 0.      ]])

pairs = np.where((a >= .11) & (a <= .99))
pairs_tuples = list(zip(pairs[0].tolist(), pairs[1].tolist()))
# [(1, 0), (3, 0), (3, 1), (3, 2)]

如何进入下方?

triplets_tuples = [(0, 1, 3)]
quadruplets_tuples = []
quintuplets_tuples = []

1 个答案:

答案 0 :(得分:1)

这有一个简单的部分和一个NP部分。这是简单部分的解决方案。

假设您具有完整的相关矩阵:

>>> c = a + a.T
>>> c
array([[0.        , 0.96078379, 0.05498203, 0.46005028, 0.1030161 ],
       [0.96078379, 0.        , 0.0552454 , 0.45468466, 0.10350956],
       [0.05498203, 0.0552454 , 0.        , 0.11167813, 0.00109096],
       [0.46005028, 0.45468466, 0.11167813, 0.        , 0.00928037],
       [0.1030161 , 0.10350956, 0.00109096, 0.00928037, 0.        ]])

您正在做的是将其转换为adjacency matrix

>>> adj = (a >= .11) & (a <= .99)
>>> adj.astype(int)  # for readability below - False and True take a lot of space
array([[0, 1, 0, 1, 0],
       [1, 0, 0, 1, 0],
       [0, 0, 0, 1, 0],
       [1, 1, 1, 0, 0],
       [0, 0, 0, 0, 0]])

这现在表示一个图形,其中列和行对应于节点,1表示它们之间的线。我们可以使用networkx来可视化此内容:

import networkx
g = networkx.from_numpy_matrix(adj)
networkx.draw(g)

enter image description here

您正在寻找该图中最大的全连接子图或“ cliques”。这是the Clique problem,是NP部分。幸运的是,networkx也可以解决该问题:

>>> list(networkx.find_cliques(g))
[[3, 0, 1], [3, 2], [4]]

[3, 0, 1]是您的三胞胎之一。