从一个数据框值与一个数据框列合并

时间:2019-02-27 18:01:02

标签: python pandas merge

我在这里遇到一个困难。我的目标是创建一个商店的销售清单,其中一个数据框按产品列出价格,另一个数据框按产品和数量(一段时间)列出所有销售额。

DataFrame 1:价格

prices = pd.DataFrame({'qty_from' : ('0','10','20'), 'qty_to' : ('9','19','29'), 'product_A' :(50,30,10),'product_B' :(24,14,12),'product_C' :(70,50,18)})

DataFrame 2:销售

sales = pd.DataFrame({'product' : ('product_b','product_b','product_a',product_c,product_b), 'qty' : ('4','12','21','41','7')})

我想在'sales'数据框内逐行获取营业额,并与'TurnOver'等其他列

我用过

pd.merge_asof(sales, prices, left_on='qty', right_on='qty_from', direction='backward') 

它给了我合适的价格,但是如何获得与一种产品相关的价格呢? 如何将“销售”数据框中的值(如“ product_b”)与数据框中价格的列名称(此处为“ product_b”)合并,然后应用计算来获取营业额?

谢谢您的帮助,

埃里克

1 个答案:

答案 0 :(得分:0)

如果我理解正确,则可以使用by修改数据框价格,以能够使用merge_asof中的参数stack

#modify price
prices_stack = (prices.set_index(['qty_from','qty_to']).stack() # then products become as a column
                     .reset_index(name='price').rename(columns={'level_2':'product'}))

# uniform the case
sales['product'] = sales['product'].str.lower()
prices_stack['product'] = prices_stack['product'].str.lower()
# this is necessary with your data here as not int
sales.qty = sales.qty.astype(int)
prices_stack.qty_from = prices_stack.qty_from.astype(int)

#now you can merge_asof adding by parameter
sales_prices = (pd.merge_asof( sales.sort_values('qty'), prices_stack, 
                               left_on='qty', right_on='qty_from', 
                               by = 'product', #first merge on the column product
                               direction='backward')
                  .drop(['qty_from','qty_to'], axis=1)) #not necessary columns

print (sales_prices)
     product  qty  price
0  product_b    4     24
1  product_b    7     24
2  product_b   12     14
3  product_a   21     10
4  product_c   41     18