理解Pearson相关系数

时间:2011-06-07 17:05:29

标签: recommendation-engine

作为生成Pearson Correlation Coefficient的计算的一部分,执行以下计算:

enter image description here

在第二个公式中:p_a,i是预测评分用户a将提供项in是与之比较的类似用户的数量,ru,i是用户i对商品u的评分。

如果用户u未对此商品进行评分,将使用什么值?我在这里误解了什么吗?

2 个答案:

答案 0 :(得分:1)

根据链接,算法第1步中的早期计算超过了一组项目,索引为1到m,而m是共同项目的总数。

算法的第3步指定:“要查找特定用户对特定项目的评级预测,首先选择与当前 用户具有最高加权相似性得分的用户数量已对相关项目进行评分 。“

这些计算仅在不同用户的评级项目集的交集处执行。当用户未对项目进行评级时,将不会执行任何计算。

答案 1 :(得分:1)

如果两个用户都评价了电影,那么计算结果才有意义。线性回归可以显示为method of finding a straight line through a two-dimensional graph,其中一个变量绘制在X轴上,另一个变量绘制在Y轴上。每个等级组合表示为欧氏平面上的一个点[u1_rating,u2_rating]。由于你不能绘制只有一个维度的点,你将不得不放弃这些情况。