我正在尝试比较不同行业的生产率和小时工资趋势。为了做到这一点,我需要将我的价值观标准化为2010年基准年,但这样做存在一些问题。具体来说,我想添加一个新列,其中包含生产率和小时工资的标准化值。
我试图为此目的使用lambda函数。但是此刻我很困,在网上找不到任何解决方案。
这是我尝试过的事情之一
df['P: indexed=2010'] = df.groupby(['industry','year'])['Productivity'].transform(lambda x: x/x.iloc[year==2010, by 'industry'])