我想计算两组数字之间的相关分数,但这些数字在每一行内
背景是我正在编译推荐系统,使用PCA为每个用户和每个项目提供每个项目的分数(在这种情况下为1,2,3)
user item user_score_1 user_score_2 user_score_3 item_score_1 item_score_2 item_score_3
A 1 0.5 0.6 -0.2 0.2 0.8 -0.3
A 2 0.5 0.6 -0.2 0.4 0.1 -0.8
A 3 0.5 0.6 -0.2 -0.2 -0.4 -0.1
B 1 -0.6 -0.1 0.9 0.2 0.8 -0.3
B 2 -0.6 -0.1 0.9 0.4 0.1 -0.8
B 3 -0.6 -0.1 0.9 -0.2 -0.4 -0.1
我已将每个用户和项目的输出合并到此全部x全部表格中。对于此表中的每一行,我需要计算用户分数1,2,3和&之间的相关性。项目得分1,2,3(例如,对于第一行,0.5,0.6,-0.2和0.2,0.8之间的相关性,-0.3),以查看用户和项目的匹配程度。
另一种选择是在加入用户之前进行关联。项目分为全部x全部数据集,但我不知道如何做到最好。
我不认为我可以转换桌面,因为实际上用户和项目总数非常大。
关于好方法的任何想法?
谢谢, 安德鲁