作为生成Pearson Correlation Coefficient的计算的一部分,执行以下计算:
在第二个公式中:p_a,i
是预测评分用户a将提供项i
,n
是与之比较的类似用户的数量,ru,i
是用户i
对商品u
的评分。
如果用户u
未对此商品进行评分,将使用什么值?我在这里误解了什么吗?
答案 0 :(得分:1)
根据链接,算法第1步中的早期计算超过了一组项目,索引为1到m
,而m
是共同项目的总数。
算法的第3步指定:“要查找特定用户对特定项目的评级预测,首先选择与当前 用户具有最高加权相似性得分的用户数量已对相关项目进行评分 。“
这些计算仅在不同用户的评级项目集的交集处执行。当用户未对项目进行评级时,将不会执行任何计算。
答案 1 :(得分:1)
如果两个用户都评价了电影,那么计算结果才有意义。线性回归可以显示为method of finding a straight line through a two-dimensional graph,其中一个变量绘制在X轴上,另一个变量绘制在Y轴上。每个等级组合表示为欧氏平面上的一个点[u1_rating,u2_rating]。由于你不能绘制只有一个维度的点,你将不得不放弃这些情况。