我有像熊猫这样的名单:
data = [
('1', '2', 8, 10),
('2', '1', 2, 7),
('4', '3', 3, 9),
('3', '4', 5, 6)
]
print data
df = pd.DataFrame(data, columns=['id_sender', 'id_receiver', 'freq', 'sum'])
print df
id_sender | id_receiver | freq | sum
1 | 2 | 10 | 5
2 | 1 | 7 | 4
3 | 4 | 4 | 8
4 | 3 | 3 | 5
我需要根据id_sender
和id_receiver
获得freq
和sum
之间的余弦相似度,其中id_sender
和id_receiver
有两种方式方向
similarity(1,2) = similarity([10 5], [7,4])
我尝试过使用数据透视表,但是它不起作用,我的意思是我不知道如何使用这种类型的表格。