在不同类别的数据框中汇总数据

时间:2019-05-04 22:05:54

标签: python pandas csv numpy dataframe

enter image description here

我用数据创建了一个Excel电子表格,并将其传输到CSV文件中。我想添加每个不同年份每个种族的数据。我试图创建一个数据索引,并尝试对每个种族进行总计,但能够保存或包含这些数据。 我用过df。以及创建的“ for”循环,这样我就可以按种族保存数据,但收到错误消息。原始的excel工作表包含与特定年份相关的特定节目的每个种族的数据框。我无法按族裔每年汇总列。

我应该使用for或if循环逐步执行特定年份吗,我的方法是否正确?

<input type="text" value={{ old('email')}} name="email">

我希望输出的结果是每年(20082009)每个种族(例如:AFRAM)的总数(大约#),但实际输出是“未定义名称'allTheaterDataV2''

1 个答案:

答案 0 :(得分:1)

这应该有效。

import pandas as pd

df = pd.DataFrame({'ID':['Billy Elliot','next to normal','shrek','guys and dolls',
                         'west side story', 'pal joey'],
                   'Season' : [20082009,20082009,20082009,
                               20082009,20082009,20082009],
                   'AFRAM' : [2,0,4,4,0,1],
                   'ASIAM' : [0,0,1,0,0,0],
                   'CAU' : [48,10,25,24,28,20],
                   'LAT' : [1,0,1,3,18,0],
                   'OTH' : [0,0,0,0,0,0]}) 

print(df)
#    AFRAM  ASIAM  CAU               ID  LAT  OTH    Season
# 0      2      0   48     Billy Elliot    1    0  20082009
# 1      0      0   10   next to normal    0    0  20082009
# 2      4      1   25            shrek    1    0  20082009
# 3      4      0   24   guys and dolls    3    0  20082009
# 4      0      0   28  west side story   18    0  20082009
# 5      1      0   20         pal joey    0    0  20082009

# drop the ID column since it is just a string
df = df.drop(['ID'], axis = 1)

# group by season and add the other columns
df = df.groupby('Season').sum()

print(df)
#             AFRAM  ASIAM  CAU  LAT  OTH
# Season                                 
# 20082009     11      1  155   23    0