皮尔逊的相关始终提供零相关

时间:2019-10-09 05:03:51

标签: python python-3.x pearson-correlation recommender-systems

我正在使用Toby Segaram的推荐代码。 Found here so you can try it out.

我注意到他的Pearson相关代码有些奇怪,我不确定这是Bug还是Peerson的自然部分。请看他的代码:

'Toby': {'Snakes on a Plane':4.5,'You, Me and Dupree':1.0,'Superman Returns':4.0}}

并将其更改为:

'Toby': {'Snakes on a Plane':4.0,'You, Me and Dupree':4.0,'Superman Returns':4.0}}

(即,对Toby的所有评级都相同。)突然之间,每个相关系数均为零,您将无法获得任何结果。为什么会这样?

我还在玩,所以如果没人能回答,我可能会回答我自己的问题。

更新:是因为earpearson拟合一条线,并且在这种情况下,Toby导致该线对所有人都是垂直的?如何解决这个问题?您在每个评分上都放了一点噪音吗?

1 个答案:

答案 0 :(得分:0)

回想起来,答案实际上很明显。皮尔逊相关使用一条线。但是在这种情况下,额定值都相同,因此直线是垂直的,这意味着其斜率是不确定的。

这是与Pearson Correlation相关的自然问题。我决定只使用欧几里得距离,而这很好用。