这是我关于Stack Overflow的第一个问题。这不是一个真正的编程问题,但由于我们大多数人都必须在某些时候处理理论问题,并且可能会有一些图论专家,我想我可能会试一试。
我目前正在对多语种网站进行一些研究,我在网站结构中发现了一些有趣的模式。下图是两个不同多语言网站的网站图。对不起,我没有足够的重复点来发布图片,所以我把它们留作链接。我使用Force Atlas算法进行布局。顶点根据页面语言着色。阴影区域对应于特定语言的子图。
以下是网站的图表,其中相同内容的不同语言版本密切相关。因此,代表不同语言版本的平面是重叠的。
http://www.ai.soc.i.kyoto-u.ac.jp/~julien/phd/images/tight.png
在第二张图中,我们有一个网站,其中网站的语言版本几乎是独立的,因此我们几乎没有重叠。
http://www.ai.soc.i.kyoto-u.ac.jp/~julien/phd/images/loose.png
所以这是我的问题:
是否有一个特定的指标来量化这种重叠?如果是这样,它的名字是什么?
因为我使用了基于力的布局,语言子图之间的边数。所以我猜想就像把子图中的边数与外面/进入特定子图中的边数之比一样,可能会有所帮助。我确信我不是第一个得到这个想法的人所以我想知道这个指标是否有名字。我可以从那里谷歌它:)
提前谢谢!
答案 0 :(得分:3)
听起来你正在寻找的是Network Modularity。给定一个图形和一个分区(将图形分解为不相交的子图),模块化定义为:
属于给定组的边缘部分减去 如果边缘随机分布,则预期会出现这样的分数。
模块化是网络上一些首先community detection算法的基础,它们试图找到密集连接的节点集。最近,模块化已经被证明是社区检测的一个很差的指标,尽管由于在某些情况下无法检测小群体或分裂明确定义的群体的分辨率限制(见this paper)。
答案 1 :(得分:1)