标签: python na pearson-correlation
我试图建立一个电影推荐系统来计算电影之间的相关性,我创建了一个数据框(数据透视表),电影(列)和用户(行),因为用户没有对所有电影进行评分,因此我的数据框包含NA值,我将梨子相关性与NA值一起应用,并在将NA值替换为0之后,我的问题是我不知道如果将NA值替换为0则应该保留NA值是否更好,这意味着电影的评分不佳我测试了两种情况,我的相关矩阵都不同 谢谢
我的数据透视表
不替换NA值的相关矩阵:
相关矩阵