皮尔逊相关问题

时间:2011-05-07 18:51:43

标签: information-retrieval correlation collaborative-filtering pearson

我不确定下面在问题中使用哪些数字我试图解决这个问题涉及使用Pearson Correlation公式。

    A  B  C  D  E  F
Bob 4  5     4  2
Fra 2  2     2  3  2
Lee 2  4  3        5
Cha 5  4     4  1

“使用Pearson Correlation和加权平均值描述基于邻域的方法,以生成Bob是否喜欢”F“的预测。您的答案应概述基于邻域的方法中的主要步骤,并显示生成预测所需的步骤”

所以我想知道Bob是否会喜欢F ...(5 =喜欢1 =不喜欢) 我理解Pearson Formula但我不确定其他'用户'可以比较Bob,或者我是否应该考虑所有用户的观点。

我也理解如何回避回答类似家庭作业的问题,但我花了几个小时在网上搜索这个问题。

任何帮助将不胜感激,提前谢谢。

1 个答案:

答案 0 :(得分:0)

可能需要查看问题的具体细节,以便为问题本身提出最佳答案,但一种似乎可行的方法是计算Bob与彼此之间的相关性(Fra,Lee和Cha) ),并根据这些相关性对F的分数进行加权。

在这种情况下,由于您只有Fra和Lee的F分数,所以只需(corr_(Bob, Fra) * 2 + corr_(Bob, Lee))/2