标签: python pandas apache-spark graph
我有一个包含两列(键,值)的数据框
key,value 1,A 1,B 2,B 2,C
如何获取邻接矩阵或邻接对(如果它们具有相同的键,则连接值),类似
A B C A 0,1,0 B 1,0,1 C 0,1,0
我尝试了pandas.crosstab,它在处理小数据时效果很好, 但是在大数据帧(3,000,000行,500,000个不同值)上出现内存错误。任何帮助将不胜感激。