sklearn python亲和力传播-是否有一种方法可以计算簇中的误差?

时间:2019-02-08 14:02:59

标签: cluster-analysis affinity propagation

在查看sklearn.cluster和Affinity Propagation的文档时,我看不到任何会在群集中计算错误的内容。这是否存在,或者这是我必须自己写的东西?

更新:让我提出一个可能的想法:

有了亲和力传播,我们有了一个不相似度矩阵(该矩阵可以衡量每行彼此之间的相异程度)。 AP完成后,我将获得它们所属的所有标签分配。如果我从矩阵中进行了差异测量,该怎么办?例如,在一个10x10的矩阵中,点3是我的聚类,并且将标签4分配给示例3。例如,质心和标签之间的差异为-5。假设有另外两个标签分配给此质心,它们的相异度分别为-3和-8。现在,如果我说总错误是-16/3。如果我有另一个具有相异性度量值的群集-2,-3,-2,-3,-2,-3 = -15/6。这似乎提供了潜在的误差度量。

1 个答案:

答案 0 :(得分:0)

我认为,没有一种普遍接受的“错误”定义在基于亲和力传播的情况下才有意义,这是一种基于相似性的方法。

错误可与基于坐标的方法(例如k均值)很好地配合,但是在AP上,我们可能没有坐标。