我要使用的路径:C:\ Users \ Bugra \ company-A \ People-Documents \ General \ The Ortak \ shops \ Results
首先,我要到达结果文件。它有几个以日期格式命名的文件。
例如
C:\Users\Bugra\company-A\People - Documents\General\The Ortak\shops\Results\2019-11-01
C:\Users\Bugra\company-A\People - Documents\General\The Ortak\shops\Results\2019-11-02
但是,这些以日期格式命名的文件也具有55个csv文件。
例如,
C:\Users\Bugra\company-A\People - Documents\General\The Ortak\shops\Results\2019-11-01\first.csv
C:\Users\Bugra\company-A\People - Documents\General\The Ortak\shops\Results\2019-11-01\second.csv
C:\Users\Bugra\company-A\People - Documents\General\The Ortak\shops\Results\2019-11-01\third.csv
.
.
.
C:\Users\Bugra\company-A\People - Documents\General\The Ortak\shops\Results\2019-11-01\fifty-fifth.csv
如果我输入2019-11-02文件:
C:\Users\Bugra\company-A\People - Documents\General\The Ortak\shops\Results\2019-11-02\first.csv
C:\Users\Bugra\company-A\People - Documents\General\The Ortak\shops\Results\2019-11-02\second.csv
C:\Users\Bugra\company-A\People - Documents\General\The Ortak\shops\Results\2019-11-02\third.csv
.
.
.
C:\Users\Bugra\company-A\People - Documents\General\The Ortak\shops\Results\2019-11-02\fifty-fifth.csv
Csv文件始终具有相同的名称。
我不得不说的最后一件事是,这些文件每天都由Web服务定期保存并保存到此位置。例如,日期必须是2019-11-30,然后我才能使用2019-11-29的数据。我向您介绍了总体结构,现在我想告诉您我想做什么。
我想获取除一个以外的所有csv文件,并将它们附加在一起。每个csv文件中都有时间戳。因此,当我将它们附加在一起时,我可以区分它们。但是我无法获得想要的数据。
这是我的代码:
import pandas as pd
import datetime
import os
report_date = datetime.date(2019,11,15)
onYesterday = report_date - datetime.timedelta(days=1)
value_of_yesterday = onYesterday.day
onYesterday = onYesterday.strftime('%Y-%m-%d')
onFirstDate = report_date.replace(day=1)
last_month_last_day = onFirstDate - datetime.timedelta(days=1)
paths = []
iter_day = last_month_last_day
for i in range(2):
iter_day += datetime.timedelta(days=1)
path = 'C:/Users/Bugra/company-A/People - Documents\General\The Ortak\shops\Results/' + str(iter_day) + '/'
comp_names = []
comp_data = pd.DataFrame()
for path, dirs, files in os.walk(path):
for filename in files:
# I read all files except one
if filename == 'company_Ex.csv': continue
filename_noext = filename.replace(".csv", "")
comp_names.append(filename_noext)
data = pd.read_csv(path + filename, index_col = 0).assign(filename = filename_noext)
comp_data = comp_data .append(data, sort = False, ignore_index = False)
comp_data = comp_data .drop_duplicates(subset = 'teklifId')
运行此代码时,我仅从前一天获取数据。我在做什么错了?