我遇到以下困难:
我有第一个以下列方式构建的Pandas df:
index|date|price
0 |2011|1000
1 |2011|1100
2 |2012|1200
3 |2013|1300
日期值是简单的字符串。
另一个df具有每年的通货膨胀率(严重计算):
date |rate
2011 |0.1
2012 |0.2
2013 |0.3
我的目标是能够使用第二个数据集来转换第一个数据集中的价格值。 (使用适当年份的价值将通货膨胀率除以价格值)
最终结果应该是这样的:
index|date|price
0 |2011|10000
1 |2011|11000
2 |2012|6000
3 |2013|4333
任何帮助非常感谢。可能解决方案已经存在,但我努力制定谷歌查询来实现它..
答案 0 :(得分:4)
你可以这样做:
In [90]: df1['price'] /= df1['date'].map(df2.set_index('date')['rate'])
In [91]: df1
Out[91]:
index date price
0 0 2011 10000.000000
1 1 2011 11000.000000
2 2 2012 6000.000000
3 3 2013 4333.333333
答案 1 :(得分:2)
只是强调在pd.DataFrame.div
axis
和level
df1.set_index(
'date', append=True
).div(
df2.set_index('date').rate, axis=0, level=1
).reset_index(1)
date price
index
0 2011 10000.000000
1 2011 11000.000000
2 2012 6000.000000
3 2013 4333.333333
df1.set_index('date', append=True)
price
index date
0 2011 1000
1 2011 1100
2 2012 1200
3 2013 1300
和
df2.set_index('date').rate
date
2011 0.1
2012 0.2
2013 0.3
Name: rate, dtype: float64
我们可以看到修改后的df1
数据框索引的级别1与修改后的'data'
索引中的df2
值相同。我们可以使用axis
和level
参数来定位该对齐方式。
那就是说,对于这个具体问题......我不能复制@MaxU!