附加for循环中生成的pandas数据帧

时间:2015-02-23 08:23:44

标签: python python-2.7 pandas

我在for循环中访问一系列Excel文件。然后我将excel文件中的数据读取到pandas数据帧。我无法弄清楚如何将这些数据帧附加在一起,然后将数据帧(现在包含所有文件中的数据)保存为新的Excel文件。

这是我尝试的内容:

for infile in glob.glob("*.xlsx"):
    data = pandas.read_excel(infile)
    appended_data = pandas.DataFrame.append(data) # requires at least two arguments
appended_data.to_excel("appended.xlsx")

谢谢!

2 个答案:

答案 0 :(得分:89)

使用pd.concat将DataFrame列表合并到一个大型DataFrame中。

appended_data = []
for infile in glob.glob("*.xlsx"):
    data = pandas.read_excel(infile)
    # store DataFrame in list
    appended_data.append(data)
# see pd.concat documentation for more info
appended_data = pd.concat(appended_data, axis=1)
# write DataFrame to an excel sheet 
appended_data.to_excel('appended.xlsx')

答案 1 :(得分:23)

你可以试试这个。

data_you_need=pd.DataFrame()
for infile in glob.glob("*.xlsx"):
    data = pandas.read_excel(infile)
    data_you_need=data_you_need.append(data,ignore_index=True)

我希望它可以提供帮助。