我有以下通过熊猫读取的数据输入。
我想将单元格“ Month Ending .....”放入新形成的“ Date”列,并将两个输入文件一起附加到一个数据框中。
这是我到目前为止尝试过的...
import pandas as pd
import glob
import os
### List Source Files That I need to Import###
path = os.getcwd()
files = os.listdir(path)
### Loading Files by Variable ###
data = pd.DataFrame()
for files in glob.glob('../Sales_Master_Data/Sales_Data/* customer *.xls'): #searches for customer .xls files in the folder
data = pd.read_excel(files,'sheet1',skiprows=0).fillna(method='ffill')#reads all files in df
date = data.columns[4] # This is where the date value is located
data['Date'] = date # Assigns date value to new ['Date'] column
df = df.append(data) # all files are appended together
df.to_csv('Output.csv')
不幸的是,它产生下面的输出。所有以“月”开头的列都需要合并到1列中,并称为['Sales Qty'],我也很难设置列标题以使其统一
答案 0 :(得分:1)
将合并的细胞喂入熊猫绝不是一个好主意。我建议的第一件事是整理您的输入。如果没有简便的方法可以回答您的原始问题,则需要创建一个多索引数据框以最好地处理数据。这已在此处的StackOverflow中进行了介绍:https://stackoverflow.com/a/27424102/9754169