有人可以帮助我理解LFR基准和随机块模型之间的区别。我试图在人工和真实数据集上比较社区检测算法,而在人工部分我不知道哪个基准生成器更合理?
答案 0 :(得分:2)
LFR模型旨在重现在现实世界网络中观察到的某些拓扑属性:社区的大小是幂律分布的,节点度也是如此。称为混合系数的参数允许控制节点在其他社区中的邻居的平均比例。
随机区块模型更为通用,从某种意义上说,它可用于生成其他形式的网络(例如,多部门或核心 - 外围而非社区结构)。用户为每对社区(分别为每个社区)指定社区之间的链接密度(分别在其中)。社区的规模不是强制分配的幂法。你没有直接控制学位分布。
LFR模型应该更加真实,这意味着它被定义为模仿在某些现实世界网络中观察到的特征。它旨在为社区检测生成基准。相比之下,块模型首先在社会学中用作描述关于现实世界网络结构的一些假设的方式。最近,随机块模型用于获取社区检测问题的分析结果以及该问题的一些解决方法(例如,确定一个方法可以理论上找到确切分区的参数边界)。
个人而言,当我需要对社区检测算法进行一些实证比较时,我在工作中使用了LFR。