Pandas在组内为组的子集移动值

时间:2017-11-16 18:20:57

标签: python pandas

我希望在组内转换值,但仅限于系列中的一组子组。

我有类似以下系列的内容:

import pandas as pd
df=pd.DataFrame()
df['Group']=['A','A','A','B','B','B','C','C','C']
df['Month']=[1,2,3,1,2,3,1,2,3]
df['Value']=1000,900,800,700,600,500,400,300,200
df=df.set_index(['Group','Month'])['Value']
df
Out[101]: 
Group  Month
A      1        1000
       2         900
       3         800
B      1         700
       2         600
       3         500
C      1         400
       2         300
       3         200
Name: Value, dtype: int64

我希望A组保持原样,但B组和C组的值应该向上移动一个。我可以在所有群组中执行此操作(如this问题中所述:

 df.groupby(level='Group').transform(lambda x:x.shift(-1))

然而,为了只针对一部分群体进行此操作,我不能提出一种比分离系列然后连接在一起更优雅的方式,如下所示:

df_a = df[df.index.get_level_values('Group')=='A']
df_other = df[df.index.get_level_values('Group')<>'A']

pd.concat([df_a,df_other.groupby(level='Group').transform(lambda x:x.shift(-1))])
Out[104]: 
Group  Month
A      1        1000.0
       2         900.0
       3         800.0
B      1         600.0
       2         500.0
       3           NaN
C      1         300.0
       2         200.0
       3           NaN
Name: Value, dtype: float64

对此有更优雅的解决方案吗?

1 个答案:

答案 0 :(得分:2)

In [361]: df.groupby(level='Group').transform(lambda x:x if x.name=='A' else x.shift(-1))
Out[361]:
Group  Month
A      1        1000.0
       2         900.0
       3         800.0
B      1         600.0
       2         500.0
       3           NaN
C      1         300.0
       2         200.0
       3           NaN
Name: Value, dtype: float64

或者您只能更新特定行(solution provided by @cᴏʟᴅsᴘᴇᴇᴅ) - 这将极大地简化解决方案:

In [363]: df.loc[['B', 'C']] = df.loc[['B', 'C']].groupby(level=0).shift(-1)

In [364]: df
Out[364]:
Group  Month
A      1        1000.0
       2         900.0
       3         800.0
B      1         600.0
       2         500.0
       3           NaN
C      1         300.0
       2         200.0
       3           NaN
Name: Value, dtype: float64