根据匹配的字符串,使用另一个df的值转换pandas df列中的值

时间:2017-07-13 14:57:43

标签: python pandas

我遇到以下困难:

我有第一个以下列方式构建的Pandas df:

index|date|price
0    |2011|1000
1    |2011|1100
2    |2012|1200
3    |2013|1300

日期值是简单的字符串。

另一个df具有每年的通货膨胀率(严重计算):

date |rate
2011 |0.1 
2012 |0.2 
2013 |0.3 

我的目标是能够使用第二个数据集来转换第一个数据集中的价格值。 (使用适当年份的价值将通货膨胀率除以价格值)

最终结果应该是这样的:

index|date|price
0    |2011|10000
1    |2011|11000
2    |2012|6000
3    |2013|4333

任何帮助非常感谢。可能解决方案已经存在,但我努力制定谷歌查询来实现它..

2 个答案:

答案 0 :(得分:4)

你可以这样做:

In [90]: df1['price'] /= df1['date'].map(df2.set_index('date')['rate'])

In [91]: df1
Out[91]:
   index  date         price
0      0  2011  10000.000000
1      1  2011  11000.000000
2      2  2012   6000.000000
3      3  2013   4333.333333

答案 1 :(得分:2)

只是强调在pd.DataFrame.div

中使用axislevel
df1.set_index(
    'date', append=True
).div(
    df2.set_index('date').rate, axis=0, level=1
).reset_index(1)

       date         price
index                    
0      2011  10000.000000
1      2011  11000.000000
2      2012   6000.000000
3      2013   4333.333333
df1.set_index('date', append=True)

            price
index date       
0     2011   1000
1     2011   1100
2     2012   1200
3     2013   1300

df2.set_index('date').rate

date
2011    0.1
2012    0.2
2013    0.3
Name: rate, dtype: float64

我们可以看到修改后的df1数据框索引的级别1与修改后的'data'索引中的df2值相同。我们可以使用axislevel参数来定位该对齐方式。

那就是说,对于这个具体问题......我不能复制@MaxU!