R数据框架中变量之间的水平相关

时间:2015-10-14 13:06:42

标签: r correlation recommendation-engine

我想计算两组数字之间的相关分数,但这些数字在每一行内

背景是我正在编译推荐系统,使用PCA为每个用户和每个项目提供每个项目的分数(在这种情况下为1,2,3)

user item user_score_1 user_score_2 user_score_3 item_score_1 item_score_2 item_score_3
 A     1       0.5          0.6         -0.2          0.2          0.8         -0.3
 A     2       0.5          0.6         -0.2          0.4          0.1         -0.8
 A     3       0.5          0.6         -0.2         -0.2         -0.4         -0.1
 B     1      -0.6         -0.1          0.9          0.2          0.8         -0.3
 B     2      -0.6         -0.1          0.9          0.4          0.1         -0.8
 B     3      -0.6         -0.1          0.9         -0.2         -0.4         -0.1

我已将每个用户和项目的输出合并到此全部x全部表格中。对于此表中的每一行,我需要计算用户分数1,2,3和&之间的相关性。项目得分1,2,3(例如,对于第一行,0.5,0.6,-0.2和0.2,0.8之间的相关性,-0.3),以查看用户和项目的匹配程度。

另一种选择是在加入用户之前进行关联。项目分为全部x全部数据集,但我不知道如何做到最好。

我不认为我可以转换桌面,因为实际上用户和项目总数非常大。

关于好方法的任何想法?

谢谢, 安德鲁

0 个答案:

没有答案