如何在没有事实根据的情况下评估社区发现

时间:2018-11-12 18:42:56

标签: graph cluster-analysis modularity

我已经在图形上执行了社区检测,并希望通过多种方式评估我的算法的性能。

现在我有了开始图,以及代表所提取社区的节点列表。对于这些社区的实际情况,我没有任何道理。

我知道模块化是评估我的算法的一种很好的指标。我想知道是否还有其他(如果掌握这些方法的代码的位置,则可以加分)

谢谢!

1 个答案:

答案 0 :(得分:0)

模块化确实是一种广泛使用的度量,并且在定义图形和社区的方式上有很多不同的扩展;例如,您的图表是有向的还是无向的,以及您的社区是独特的还是重叠的。还有一些关于模糊隶属度的模块化指标。

但是模块化将聚类与其他情况下随机生成的图进行比较。关于度量模块性的好坏,普遍存在争论。(请参阅Fortunato 2010)。

我认为,关于社区的好处的无模型证据是类似的论点,但从密度的角度来看。关于社区存在的一个主要论据是,集群内部比集群之间的连接更密集。因此,换句话说,您可以调查社区内部链接的密度,并将其与社区到外部的链接进行比较。如果您将网络级别的密度称为d,并将特定群集的密度称为d_in,并将整个群集和外界的密度称为d_out,那么您应该具有:

d_in > d > d_out