标签: python graph pyspark bigdata graphframes
我正在努力寻找最有效的计算方法:
用于大图中的边(约600M边,~30M顶点)。 我可用的工具是pyspark,graphframes和networkx。
Networkx确实拥有我正在寻找的所有功能,但由于内存有限和数据量大,它对我不起作用,所以我试图找到另一种方法来计算这些参数,最好是现有的包。
任何想法?