我正在从事一个人力资源项目,在该项目中,我必须掌握员工的技能并以一种可以建立技能分类法的方式与他们建立联系。我选择创建一个无向网络图,在该图中,员工的技能组合中同时使用两种技能时,会在两者之间画一条边,而权重就是员工使用这些相关技能的次数。
该图中约有8000个节点和数百万个连接。我的下一个任务是以这种方式聚集该图,以便我可以看到哪些技能是相似的。
问题在于NetworkX中提供的所有算法(例如:连接的子图组件,聚类等)仅适用于2000个节点。当我尝试增加节点数时,没有得到清晰的结果。
有没有一种方法可以在8000个非常连接的节点上集群?有什么建议么?我正在使用Python。