Python / Pandas:创建汇总表

时间:2016-05-30 19:30:06

标签: python pandas dataframe pivot

在python pandas数据框" df"中,我有以下列:

user_id | song_id | song_duration | song_title | artist | listen_count

许多用户可能听过同一首歌 - 因此该歌曲在此表中并不是唯一的。我想创建一个只有歌曲信息的第二个数据帧(带有独特的song_ids)。

song_id | song_title | artist

我设法用song_id和song_title创建一个表。

song_df = df.groupby('song_id').song_title.first()

如何添加,专栏"艺术家"进入这个?

这不起作用:

song_df = df.groupby('song_id').df['song_title','artist'].first()
  

AttributeError:' DataFrameGroupBy'对象没有属性' df'

2 个答案:

答案 0 :(得分:1)

IIUC尝试省略.df

df.groupby('song_id')['song_title','artist'].first()

答案 1 :(得分:0)

您可以删除所选列的副本

song_df = df[['song_id','song_title','artist']].drop_duplicates()