我不确定下面在问题中使用哪些数字我试图解决这个问题涉及使用Pearson Correlation公式。
A B C D E F
Bob 4 5 4 2
Fra 2 2 2 3 2
Lee 2 4 3 5
Cha 5 4 4 1
“使用Pearson Correlation和加权平均值描述基于邻域的方法,以生成Bob是否喜欢”F“的预测。您的答案应概述基于邻域的方法中的主要步骤,并显示生成预测所需的步骤”
所以我想知道Bob是否会喜欢F ...(5 =喜欢1 =不喜欢) 我理解Pearson Formula但我不确定其他'用户'可以比较Bob,或者我是否应该考虑所有用户的观点。
我也理解如何回避回答类似家庭作业的问题,但我花了几个小时在网上搜索这个问题。
任何帮助将不胜感激,提前谢谢。
答案 0 :(得分:0)
可能需要查看问题的具体细节,以便为问题本身提出最佳答案,但一种似乎可行的方法是计算Bob与彼此之间的相关性(Fra,Lee和Cha) ),并根据这些相关性对F的分数进行加权。
在这种情况下,由于您只有Fra和Lee的F分数,所以只需(corr_(Bob, Fra) * 2 + corr_(Bob, Lee))/2