如何从熊猫数据中获得余弦相似性

时间:2016-08-16 23:16:46

标签: python pandas

我有像熊猫这样的名单:

data = [
    ('1', '2', 8, 10),
    ('2', '1', 2, 7),
    ('4', '3', 3, 9),
    ('3', '4', 5, 6)
  ]
  print data
  df = pd.DataFrame(data, columns=['id_sender', 'id_receiver', 'freq', 'sum'])
  print df

id_sender | id_receiver | freq | sum
1         | 2           | 10   | 5
2         | 1           | 7    | 4
3         | 4           | 4    | 8
4         | 3           | 3    | 5

我需要根据id_senderid_receiver获得freqsum之间的余弦相似度,其中id_senderid_receiver有两种方式方向

similarity(1,2) = similarity([10 5], [7,4])

我尝试过使用数据透视表,但是它不起作用,我的意思是我不知道如何使用这种类型的表格。

0 个答案:

没有答案