Question

我有一个数据集，其中包含视频游戏，其销售情况以及该游戏的发行年份。我只是在寻找每年的游戏销量，而不是每年每个游戏的销量。

我正在使用熊猫数据框。我尝试了groupby方法。我已经尝试过使用.unique（）值进行循环。

df = df[["Year", "NA_Sales"]]
df.Year = df.Year.astype(int)
df2 = df
df2.Year = df.Year.unique()

df2 = df.groupby(['Year'])['NA_Sales'].sum()

预期结果将是一个数据框，其中包括一列唯一年份的值以及该年所有视频游戏销售的一列

Answer 1

您可以使用

df.groupby('Year', as_index=False)['NA_Sales'].sum()

Answer 2

这对我有用：

import pandas as pd

path = r'your path'
wb = pd.read_excel(path)
df =  pd.DataFrame(wb)
df.style.hide_index()
df1 = df[['YEAR', 'NA_SALES']]
GB=df1.groupby([df1['YEAR']]).sum()

请确保在创建DataFrame时dtype不是str。

如何基于另一列中的值对列数据框中的值求和

2 个答案: