在pandas:loc或join中加入数据帧的最有效方法?

时间:2017-03-15 11:53:31

标签: python pandas join loc

假设我有两个数据帧;一个持有交易trans,另一个持有产品信息prod,我想将产品价格(变量price)加入到交易数据框中,重复下来每一栏。以下哪种方法更有效/更受欢迎:

方法1:

trans = trans.set_index('product_id').join(trans.set_index('product_id'))

方法2:

trans.set_index('product_id',inplace=True)
trans['price'] = prod.loc[trans.product_id, 'price']

1 个答案:

答案 0 :(得分:1)

您似乎需要map

trans = pd.DataFrame({'product_id':[1,2,3],
                   'price':[4,5,6]})

print (trans)
   price  product_id
0      4           1
1      5           2
2      6           3

prod = pd.DataFrame({'product_id':[1,2,4],
                   'price':[40,50,60]})

print (prod)
   price  product_id
0     40           1
1     50           2
2     60           4

d = prod.set_index('product_id')['price'].to_dict()
trans['price'] = trans['product_id'].map(d)
print (trans)
   price  product_id
0   40.0           1
1   50.0           2
2    NaN           3