我想在数据透视表中从另一列中减去一列。 ' DIFF'应该是2017年和2016年之间的差异
raw_data = {'year': [2016,2016,2017,2017],
'area': ['A','B','A','B'],
'age': [10,12,50,52]}
df1 = pd.DataFrame(raw_data, columns = ['year','area','age'])
table=pd.pivot_table(df1,index=['area'],columns=['year'],values['age'],aggfunc='mean')
table['diff']=table['2017']-table['2016']
答案 0 :(得分:1)
您需要移除[]
中的pivot_table
,不要在列中创建MultiIndex
:
table=pd.pivot_table(df1,index='area',columns='year',values='age',aggfunc='mean')
print (table)
year 2016 2017
area
A 10 50
B 12 52
table['diff']=table[2017]-table[2016]
print (table)
year 2016 2017 diff
area
A 10 50 40
B 12 52 40
另一种可能的解决方案是droplevel
:
table=pd.pivot_table(df1,index=['area'],columns=['year'],values=['age'],aggfunc='mean')
table.columns = table.columns.droplevel(0)
print (table)
year 2016 2017
area
A 10 50
B 12 52