在Python中用csv打印逐年流行的电影

时间:2018-02-11 20:54:41

标签: python pandas csv

我有一个excel格式的电影数据集合。它有年份,标题,受欢迎程度的列。我的目标是创建一个具有最受欢迎的年度电影的数据帧。目前我只能创建年份和受欢迎程度。我也想添加电影标题。有什么想法吗?

df=pd.DataFrame(data)
xd=data.groupby(['release_year']).max()['popularity']
xf=pd.DataFrame(xd)
xd.head(100)

输出就像这样

1960     2.610362
1961     2.631987
1962     3.170651

我也想要电影名称。 提前谢谢:)

1 个答案:

答案 0 :(得分:0)

您只需要转换索引。

让我们说这是您的数据:

release_year, popularity, movie
1999, 5, a
1999, 4, c
2000, 3, b
2000, 4, d

执行以下操作:

import pandas as pd
data= pd.read_csv('data.csv')
idx = data.groupby(['release_year'])['popularity'].transform(max) == data['popularity']

data['popularity']的结果是:

release_year popularity movie
1999  5 a
2000 4 b