我已经开始使用gephi来帮助我显示数据集。 数据集包含:
标签(特定图片的字词)为节点
标准化Google相似度这些标记之间的距离为边且权重(介于0和1之间)
每个标签都连接到其他每个标签,只要它们都属于同一张图片。所以我为每张图片都有一个节点和边缘簇。
我现在已按以下格式将此数据集导入gephi:
节点: id,标签
边缘:目标,来源,重量(介于0和1之间)
像500个节点和6000个边缘。
我现在的问题是,在导入所有这些节点和边缘后,图形看起来有点没有实际的顺序。每张图片的每个簇都混合到其他图片的其他簇中。 现在使用Modularity作为Partitition算法(应该使用Louvain方法)图形变色,每种颜色代表一张图片。现在我可以使用Force Atlas 2 Layout来分割这个混乱。
我现在有一个彩色图表,有15个簇(每个簇都有1张图片)
现在我想根据标准化的谷歌距离(边缘的重量)使用标签(节点)再次聚类这些集群,那么它们应该是它们含义上相等的标签。
我希望你们明白我想要完成的事情。 我还可以上传图片来澄清它。
非常感谢
答案 0 :(得分:1)
我认为你不能用标准版的Gephi做到这一点。您需要开发一个插件来实现流程的最后一步。
Gephi适用于可视化和浏览图形,但(目前)在处理拓扑属性时有更多完整的工具。例如,igraph库(在C,R和python中可用)可能更适合您。请注意,您可以使用兼容Gephi和igraph的文件格式,这样您就可以在同一数据上使用这两种工具。
答案 1 :(得分:0)
我能够解决我的问题。我不得不自己导入这15个集群中的每一个。通过这种方式,我可以在少数人使用Modularity方法。