cluster-analysis - sklearn python亲和力传播-是否有一种方法可以计算簇中的误差？

sklearn python亲和力传播-是否有一种方法可以计算簇中的误差？

时间：2019-02-08 14:02:59

标签： cluster-analysis affinity propagation

在查看sklearn.cluster和Affinity Propagation的文档时，我看不到任何会在群集中计算错误的内容。这是否存在，或者这是我必须自己写的东西？

更新：让我提出一个可能的想法：

有了亲和力传播，我们有了一个不相似度矩阵（该矩阵可以衡量每行彼此之间的相异程度）。 AP完成后，我将获得它们所属的所有标签分配。如果我从矩阵中进行了差异测量，该怎么办？例如，在一个10x10的矩阵中，点3是我的聚类，并且将标签4分配给示例3。例如，质心和标签之间的差异为-5。假设有另外两个标签分配给此质心，它们的相异度分别为-3和-8。现在，如果我说总错误是-16/3。如果我有另一个具有相异性度量值的群集-2，-3，-2，-3，-2，-3 = -15/6。这似乎提供了潜在的误差度量。

1 个答案:

答案 0 :(得分：0)

我认为，没有一种普遍接受的“错误”定义在基于亲和力传播的情况下才有意义，这是一种基于相似性的方法。

错误可与基于坐标的方法（例如k均值）很好地配合，但是在AP上，我们可能没有坐标。