Gephi中的聚类(Louvain方法)

时间:2013-04-30 16:00:41

标签: graph cluster-analysis gephi

我已经开始使用gephi来帮助我显示数据集。 数据集包含:

标签(特定图片的字词)为节点

标准化Google相似度这些标记之间的距离为且权重(介于0和1之间)

每个标签都连接到其他每个标签,只要它们都属于同一张图片。所以我为每张图片都有一个节点和边缘簇。

我现在已按以下格式将此数据集导入gephi:

节点: id,标签

边缘:目标,来源,重量(介于0和1之间)

像500个节点和6000个边缘。

我现在的问题是,在导入所有这些节点和边缘后,图形看起来有点没有实际的顺序。每张图片的每个簇都混合到其他图片的其他簇中。 现在使用Modularity作为Partitition算法(应该使用Louvain方法)图形变色,每种颜色代表一张图片。现在我可以使用Force Atlas 2 Layout来分割这个混乱。

我现在有一个彩色图表,有15个簇(每个簇都有1张图片)

现在我想根据标准化的谷歌距离(边缘的重量)使用标签(节点)再次聚类这些集群,那么它们应该是它们含义上相等的标签。

我希望你们明白我想要完成的事情。 我还可以上传图片来澄清它。

非常感谢

2 个答案:

答案 0 :(得分:1)

我认为你不能用标准版的Gephi做到这一点。您需要开发一个插件来实现流程的最后一步。

Gephi适用于可视化和浏览图形,但(目前)在处理拓扑属性时有更多完整的工具。例如,igraph库(在C,R和python中可用)可能更适合您。请注意,您可以使用兼容Gephi和igraph的文件格式,这样您就可以在同一数据上使用这两种工具。

答案 1 :(得分:0)

我能够解决我的问题。我不得不自己导入这15个集群中的每一个。通过这种方式,我可以在少数人使用Modularity方法。