我已经在图形上执行了社区检测,并希望通过多种方式评估我的算法的性能。
现在我有了开始图,以及代表所提取社区的节点列表。对于这些社区的实际情况,我没有任何道理。
我知道模块化是评估我的算法的一种很好的指标。我想知道是否还有其他(如果掌握这些方法的代码的位置,则可以加分)
谢谢!
答案 0 :(得分:0)
模块化确实是一种广泛使用的度量,并且在定义图形和社区的方式上有很多不同的扩展;例如,您的图表是有向的还是无向的,以及您的社区是独特的还是重叠的。还有一些关于模糊隶属度的模块化指标。
但是模块化将聚类与其他情况下随机生成的图进行比较。关于度量模块性的好坏,普遍存在争论。(请参阅Fortunato 2010)。
我认为,关于社区的好处的无模型证据是类似的论点,但从密度的角度来看。关于社区存在的一个主要论据是,集群内部比集群之间的连接更密集。因此,换句话说,您可以调查社区内部链接的密度,并将其与社区到外部的链接进行比较。如果您将网络级别的密度称为d,并将特定群集的密度称为d_in,并将整个群集和外界的密度称为d_out,那么您应该具有:
d_in > d > d_out
。