我需要计算皮尔逊相关性,但是我使用python缺少值

时间:2019-10-22 17:31:22

标签: python na pearson-correlation

我试图建立一个电影推荐系统来计算电影之间的相关性,我创建了一个数据框(数据透视表),电影(列)和用户(行),因为用户没有对所有电影进行评分,因此我的数据框包含NA值,我将梨子相关性与NA值一起应用,并在将NA值替换为0之后,我的问题是我不知道如果将NA值替换为0则应该保留NA值是否更好,这意味着电影的评分不佳我测试了两种情况,我的相关矩阵都不同 谢谢

我的数据透视表

不替换NA值的相关矩阵:

替换NA值后的

相关矩阵

0 个答案:

没有答案