2每日文件放置在一个文件夹中,格式为Items_20190102和Items_20190102_orig。
我想通过循环来提取文件,而不会使'orig'结尾,并在项目级别使用groupby进行汇总。
我想将每日总计汇总为每月运行总计,以便在全年中生成每月的仪表板。
到目前为止,我已经能够在项目级别对数据进行分组,然后根据三个汇总总计来计算当天的运行总计。
import pandas as pd
l = ['Umbrella', 'Umbrella']
df = pd.DataFrame({'Date':['10/2/2011', '11/2/2011', '12/2/2011', '13/2/2011'],
'Product':['Umbrella', 'Umbrella', 'Badminton', 'Shuttle'],
'Last Price':[1200, 1500, 1600, 352],
'Updated Price':[1250, 1450, 1550, 400],
'Discount':[10, 10, 10, 10]})
Uncalibrated = df[df['Product'].isin(l)].groupby('Product')['Last Price'].sum()
Uncalibrated_abs = abs(uncalibrated)
Uncalibrated spend = Uncalibrated_abs.sum()
Calibrated = df[~df['Product'].isin(l)].groupby('Product')['Last Price'].tail(1)
Calibrated_Abs = abs(Calibrated)
Calibrated spend = Calibrated_Abs.sum()
Total = df.groupby(['Product'])['Last Price'].sum()
Total_Spend = abs(Total).sum()
此代码的结果将采用三个汇总统计信息的形式:
现在,我想生成一个循环,以便该代码每天运行它,将从该日常文件生成的三个统计信息附加到带有日期作为标题,并在另一列上生成该月的运行总计。
输出
26/06/2019 27/06/2016 Cum Monthly Total