用于在python或Java中可视化聚类的包?

时间:2014-04-11 03:22:25

标签: python cluster-analysis packages data-visualization agent-based-modeling

我正在进行基于代理的建模,目前已在Python中进行此设置,但如有必要,我可以切换到Java。 我在Twitter上有一个数据集(1100万个节点和8500万个有向边),我已经设置了一个字典/散列图,以便密钥是特定用户A,其值是所有关注者的列表(跟随用户的人)一个)。 "节点"实际上只是整数ID号(唯一),没有其他数据。我希望能够通过某种聚类方法可视化这些数据。并非所有单个节点都必须可视化,但我希望能够清楚地显示具有n个最多关注者的节点,并且该节点周围的周围区域将代表跟随它的所有人。我在整个地图中对某些东西的传播进行建模,因此我需要节点和节点周围的区域来改变颜色。理想情况下,它将是一个连续的可视化,但我不介意它只是在每次迭代时拍摄快照。
另外,我正在考虑将这些集群分开,以便: 如果A人和B人有足够的追随者可以单独观察,并且A和B人相互连接(一个跟随另一个或者甚至两个方向),那么他们都是可视化的,但是尽管被连接在一起,但在视觉上是彼此分离的可视化更清晰。

无论如何,我想知道是否有一个Python(最好)或Java的包可以让人轻松地做到这一点。

1 个答案:

答案 0 :(得分:0)

Gephi有一个非常好的GUI和一个关联的Java toolkit。您可以在GUI中尝试可视化布局,直到您拥有所需的一切,然后使用工具包编写自己的版本。