循环浏览包含CSV文件的目录以执行操作

时间:2019-06-27 15:10:14

标签: python loops csv

2每日文件放置在一个文件夹中,格式为Items_20190102和Items_20190102_orig。

我想通过循环来提取文件,而不会使'orig'结尾,并在项目级别使用groupby进行汇总。

我想将每日总计汇总为每月运行总计,以便在全年中生成每月的仪表板。

到目前为止,我已经能够在项目级别对数据进行分组,然后根据三个汇总总计来计算当天的运行总计。

  1. 未校准支出
  2. 校准支出。
  3. 总支出
import pandas as pd

l = ['Umbrella', 'Umbrella']

df = pd.DataFrame({'Date':['10/2/2011', '11/2/2011', '12/2/2011', '13/2/2011'], 
                   'Product':['Umbrella', 'Umbrella', 'Badminton', 'Shuttle'], 
                   'Last Price':[1200, 1500, 1600, 352], 
                   'Updated Price':[1250, 1450, 1550, 400], 
                   'Discount':[10, 10, 10, 10]}) 

Uncalibrated = df[df['Product'].isin(l)].groupby('Product')['Last Price'].sum() 
Uncalibrated_abs = abs(uncalibrated)
Uncalibrated spend = Uncalibrated_abs.sum()
Calibrated = df[~df['Product'].isin(l)].groupby('Product')['Last Price'].tail(1)
Calibrated_Abs = abs(Calibrated)
Calibrated spend = Calibrated_Abs.sum()
Total = df.groupby(['Product'])['Last Price'].sum() 
Total_Spend = abs(Total).sum()

此代码的结果将采用三个汇总统计信息的形式:

  1. 未校准支出。
  2. 校准支出。
  3. 总支出。

现在,我想生成一个循环,以便该代码每天运行它,将从该日常文件生成的三个统计信息附加到带有日期作为标题,并在另一列上生成该月的运行总计。

输出

                          26/06/2019 27/06/2016 Cum Monthly Total
  1. 未校准支出。 xxxxxx xxxx xxxx
  2. 校准支出。 xxxxxx xxxx xxxx
  3. 总支出。 xxxxxx xxxx xxxx

0 个答案:

没有答案