我有一个excel格式的电影数据集合。它有年份,标题,受欢迎程度的列。我的目标是创建一个具有最受欢迎的年度电影的数据帧。目前我只能创建年份和受欢迎程度。我也想添加电影标题。有什么想法吗?
df=pd.DataFrame(data)
xd=data.groupby(['release_year']).max()['popularity']
xf=pd.DataFrame(xd)
xd.head(100)
输出就像这样
1960 2.610362
1961 2.631987
1962 3.170651
我也想要电影名称。 提前谢谢:)
答案 0 :(得分:0)
您只需要转换索引。
让我们说这是您的数据:
release_year, popularity, movie
1999, 5, a
1999, 4, c
2000, 3, b
2000, 4, d
执行以下操作:
import pandas as pd
data= pd.read_csv('data.csv')
idx = data.groupby(['release_year'])['popularity'].transform(max) == data['popularity']
data['popularity']
的结果是:
release_year popularity movie
1999 5 a
2000 4 b