我希望在组内转换值,但仅限于系列中的一组子组。
我有类似以下系列的内容:
import pandas as pd
df=pd.DataFrame()
df['Group']=['A','A','A','B','B','B','C','C','C']
df['Month']=[1,2,3,1,2,3,1,2,3]
df['Value']=1000,900,800,700,600,500,400,300,200
df=df.set_index(['Group','Month'])['Value']
df
Out[101]:
Group Month
A 1 1000
2 900
3 800
B 1 700
2 600
3 500
C 1 400
2 300
3 200
Name: Value, dtype: int64
我希望A组保持原样,但B组和C组的值应该向上移动一个。我可以在所有群组中执行此操作(如this问题中所述:
df.groupby(level='Group').transform(lambda x:x.shift(-1))
然而,为了只针对一部分群体进行此操作,我不能提出一种比分离系列然后连接在一起更优雅的方式,如下所示:
df_a = df[df.index.get_level_values('Group')=='A']
df_other = df[df.index.get_level_values('Group')<>'A']
pd.concat([df_a,df_other.groupby(level='Group').transform(lambda x:x.shift(-1))])
Out[104]:
Group Month
A 1 1000.0
2 900.0
3 800.0
B 1 600.0
2 500.0
3 NaN
C 1 300.0
2 200.0
3 NaN
Name: Value, dtype: float64
对此有更优雅的解决方案吗?
答案 0 :(得分:2)
In [361]: df.groupby(level='Group').transform(lambda x:x if x.name=='A' else x.shift(-1))
Out[361]:
Group Month
A 1 1000.0
2 900.0
3 800.0
B 1 600.0
2 500.0
3 NaN
C 1 300.0
2 200.0
3 NaN
Name: Value, dtype: float64
或者您只能更新特定行(solution provided by @cᴏʟᴅsᴘᴇᴇᴅ) - 这将极大地简化解决方案:
In [363]: df.loc[['B', 'C']] = df.loc[['B', 'C']].groupby(level=0).shift(-1)
In [364]: df
Out[364]:
Group Month
A 1 1000.0
2 900.0
3 800.0
B 1 600.0
2 500.0
3 NaN
C 1 300.0
2 200.0
3 NaN
Name: Value, dtype: float64