如何从熊猫列标题中的日期值分配列变量“日期”

时间:2018-07-12 23:29:55

标签: python pandas

我有以下通过熊猫读取的数据输入。

enter image description here

enter image description here

我想将单元格“ Month Ending .....”放入新形成的“ Date”列,并将两个输入文件一起附加到一个数据框中。

这是我到目前为止尝试过的...

import pandas as pd    
import glob 
import os 


### List Source Files That I need to Import###
path  = os.getcwd()
files = os.listdir(path)

### Loading Files by Variable ###

data = pd.DataFrame()


for files in glob.glob('../Sales_Master_Data/Sales_Data/* customer *.xls'): #searches for customer .xls files in the folder

    data = pd.read_excel(files,'sheet1',skiprows=0).fillna(method='ffill')#reads all files in df
    date = data.columns[4] # This is where the date value is located
    data['Date'] = date # Assigns date value to new ['Date'] column
    df  = df.append(data) # all files are appended together
    df.to_csv('Output.csv')

不幸的是,它产生下面的输出。所有以“月”开头的列都需要合并到1列中,并称为['Sales Qty'],我也很难设置列标题以使其统一enter image description here

理想的输出看起来像这样..... enter image description here

1 个答案:

答案 0 :(得分:1)

将合并的细胞喂入熊猫绝不是一个好主意。我建议的第一件事是整理您的输入。如果没有简便的方法可以回答您的原始问题,则需要创建一个多索引数据框以最好地处理数据。这已在此处的StackOverflow中进行了介绍:https://stackoverflow.com/a/27424102/9754169