处理文件夹中的每个CSV文件

时间:2015-02-17 15:49:04

标签: python pandas

我正在尝试从特定文件夹导入一堆CSV文件并单独处理每个CSV文件(并为每个已处理的CSV文件打印结果)。

以下代码读取感兴趣的CSV文件,但是当我实际尝试处理数据时(代码的最后两行),我只收到一个结果,这对应于代码读取的最后一个文件。我猜,问题在于,代码可能会计算每个CSV文件的输出,但是,它会覆盖实际结果。

import os, glob

import pandas as pd

path = "J:\Tre\Data\CSVS"

for files in glob.glob("*_monday_*.csv"):

   dataframe = pd.read_csv(files, sep=",")

dataframe.columns = ["IDS", "Alfa", "Beta", "Gamma"]

Alfa = dataframe['Alfa']

Beta = dataframe['Beta']

Gamma= dataframe['Gamma']

AlfaAlfa = Beta-Gamma

sum(Alfa[AlfaAlfa==0])/Alfa.sum()

1 个答案:

答案 0 :(得分:0)

您必须为每个文件创建单独的数据框,然后加入或合并所有数据框。 有关更多信息,请访问http://pandas.pydata.org/pandas-docs/stable/merging.html

关于你的错误: 之所以发生这种情况,是因为您正在为每个文件反复编辑相同的变量。因此,覆盖。