使用pandas在循环中读取CSV文件,然后连接它们

时间:2017-09-30 13:00:07

标签: python list pandas dataframe

我有10个csv文件,名为data_run1_all.csvdata_run2_all.csv,...,data_run10_all.csv。 CSV文件具有相同的列,但行不同。

现在我将它们逐个导入df_run1df_run2,...,df_run10

我可以使用循环导入它们吗?类似于:i=1 to 10, df_runi=pandas.read_csv('data_runi_all.csv')

我在问,因为每个数据框的数据分析,绘图等也是一样的。每个数据帧的所有代码重复10次。如果我可以使用循环执行10次,则代码将更短且可读。

2 个答案:

答案 0 :(得分:3)

循环阅读您的CSV并致电pd.concat

file_name = 'data_run{}_all.csv'
df_list = []
for i in range(1, 11):
    df_list.append(pd.read_csv(file_name.format(i))

df = pd.concat(df_list)

或者,您可以在理解中构建列表:

file_name = 'data_run{}_all.csv'
df = pd.concat([pd.read_csv(file_name.format(i)) for i in range(1, 11)])

答案 1 :(得分:0)

您需要将df_run列入清单。你可以这样做:

df_run = []
for i in range(1,10):
  df_run.append(pandas.read_csv('data_run{0}_all.csv'.format(i))
for df in df_run:
  // Do your processing

或者在一个循环中完成所有操作,并避免使用列表。