考虑以下数据框和列: films_df = ['userId','movieId','rating','timestamp'] rating_df = ['movieId','title','genres']
答案 0 :(得分:0)
假设“评分”是一个数字,pandas.core.groupby.GroupBy.mean应该可以:
movies_df.groupby('movieId')['rating'].mean()
基于评论的修改:
似乎您需要对第一个df的收视率进行分组和平均,然后将这些结果合并到第二个df。像这样:
avg_ratings = movies_df.groupby('movieId')['rating'].mean().reset_index()
merged = pd.merge(rating_df, avg_ratings, how='outer')
merged
将包含带有movieId,标题,流派和“ avg_rating”的信息