我在这里遇到一个困难。我的目标是创建一个商店的销售清单,其中一个数据框按产品列出价格,另一个数据框按产品和数量(一段时间)列出所有销售额。
DataFrame 1:价格
prices = pd.DataFrame({'qty_from' : ('0','10','20'), 'qty_to' : ('9','19','29'), 'product_A' :(50,30,10),'product_B' :(24,14,12),'product_C' :(70,50,18)})
DataFrame 2:销售
sales = pd.DataFrame({'product' : ('product_b','product_b','product_a',product_c,product_b), 'qty' : ('4','12','21','41','7')})
我想在'sales'数据框内逐行获取营业额,并与'TurnOver'等其他列
我用过
pd.merge_asof(sales, prices, left_on='qty', right_on='qty_from', direction='backward')
它给了我合适的价格,但是如何获得与一种产品相关的价格呢? 如何将“销售”数据框中的值(如“ product_b”)与数据框中价格的列名称(此处为“ product_b”)合并,然后应用计算来获取营业额?
谢谢您的帮助,
埃里克
答案 0 :(得分:0)
如果我理解正确,则可以使用by
修改数据框价格,以能够使用merge_asof
中的参数stack
:
#modify price
prices_stack = (prices.set_index(['qty_from','qty_to']).stack() # then products become as a column
.reset_index(name='price').rename(columns={'level_2':'product'}))
# uniform the case
sales['product'] = sales['product'].str.lower()
prices_stack['product'] = prices_stack['product'].str.lower()
# this is necessary with your data here as not int
sales.qty = sales.qty.astype(int)
prices_stack.qty_from = prices_stack.qty_from.astype(int)
#now you can merge_asof adding by parameter
sales_prices = (pd.merge_asof( sales.sort_values('qty'), prices_stack,
left_on='qty', right_on='qty_from',
by = 'product', #first merge on the column product
direction='backward')
.drop(['qty_from','qty_to'], axis=1)) #not necessary columns
print (sales_prices)
product qty price
0 product_b 4 24
1 product_b 7 24
2 product_b 12 14
3 product_a 21 10
4 product_c 41 18