我有两个不同的 .csv 文件,如下所示:
movies.csv
movieId movie rating
1 StarWars-iv
2 Avengers
3 About time
4 MI-fallout
5 It
ratings.csv
userId movieId rating
1 1 4
2 1 4.5
3 1 3.5
4 1 3
5 1 5
1 2 3.4
3 2 4.5
现在,我想根据不同的用户来计算电影的平均评价,并将其添加到 movies.csv 的 rating 列中。
ex:星球大战的平均评分为(4 + 4.5 + 3.5 + 3 + 5)/ 5 = 4 。 电影的ID为1。 因此它应与中的movieId匹配并添加到评分中。
预期输出:
movieId movie rating
1 StarWars-iv 4
2 Avengers some number
3 About time some number
4 MI-fallout some number
5 It some number
是否有使用 Pandas 或 Numpy 的简便方法? 如何根据ID匹配行?