我正在尝试从特定文件夹导入一堆CSV文件并单独处理每个CSV文件(并为每个已处理的CSV文件打印结果)。
以下代码读取感兴趣的CSV文件,但是当我实际尝试处理数据时(代码的最后两行),我只收到一个结果,这对应于代码读取的最后一个文件。我猜,问题在于,代码可能会计算每个CSV文件的输出,但是,它会覆盖实际结果。
import os, glob
import pandas as pd
path = "J:\Tre\Data\CSVS"
for files in glob.glob("*_monday_*.csv"):
dataframe = pd.read_csv(files, sep=",")
dataframe.columns = ["IDS", "Alfa", "Beta", "Gamma"]
Alfa = dataframe['Alfa']
Beta = dataframe['Beta']
Gamma= dataframe['Gamma']
AlfaAlfa = Beta-Gamma
sum(Alfa[AlfaAlfa==0])/Alfa.sum()
答案 0 :(得分:0)
您必须为每个文件创建单独的数据框,然后加入或合并所有数据框。 有关更多信息,请访问http://pandas.pydata.org/pandas-docs/stable/merging.html
关于你的错误: 之所以发生这种情况,是因为您正在为每个文件反复编辑相同的变量。因此,覆盖。