在查看sklearn.cluster和Affinity Propagation的文档时,我看不到任何会在群集中计算错误的内容。这是否存在,或者这是我必须自己写的东西?
更新:让我提出一个可能的想法:
有了亲和力传播,我们有了一个不相似度矩阵(该矩阵可以衡量每行彼此之间的相异程度)。 AP完成后,我将获得它们所属的所有标签分配。如果我从矩阵中进行了差异测量,该怎么办?例如,在一个10x10的矩阵中,点3是我的聚类,并且将标签4分配给示例3。例如,质心和标签之间的差异为-5。假设有另外两个标签分配给此质心,它们的相异度分别为-3和-8。现在,如果我说总错误是-16/3。如果我有另一个具有相异性度量值的群集-2,-3,-2,-3,-2,-3 = -15/6。这似乎提供了潜在的误差度量。
答案 0 :(得分:0)
我认为,没有一种普遍接受的“错误”定义在基于亲和力传播的情况下才有意义,这是一种基于相似性的方法。
错误可与基于坐标的方法(例如k均值)很好地配合,但是在AP上,我们可能没有坐标。