我正在使用Toby Segaram的推荐代码。 Found here so you can try it out.
我注意到他的Pearson相关代码有些奇怪,我不确定这是Bug还是Peerson的自然部分。请看他的代码:
'Toby': {'Snakes on a Plane':4.5,'You, Me and Dupree':1.0,'Superman Returns':4.0}}
并将其更改为:
'Toby': {'Snakes on a Plane':4.0,'You, Me and Dupree':4.0,'Superman Returns':4.0}}
(即,对Toby的所有评级都相同。)突然之间,每个相关系数均为零,您将无法获得任何结果。为什么会这样?
我还在玩,所以如果没人能回答,我可能会回答我自己的问题。
更新:是因为earpearson拟合一条线,并且在这种情况下,Toby导致该线对所有人都是垂直的?如何解决这个问题?您在每个评分上都放了一点噪音吗?
答案 0 :(得分:0)
回想起来,答案实际上很明显。皮尔逊相关使用一条线。但是在这种情况下,额定值都相同,因此直线是垂直的,这意味着其斜率是不确定的。
这是与Pearson Correlation相关的自然问题。我决定只使用欧几里得距离,而这很好用。