我有10个csv文件,名为data_run1_all.csv
,data_run2_all.csv
,...,data_run10_all.csv
。 CSV文件具有相同的列,但行不同。
现在我将它们逐个导入df_run1
,df_run2
,...,df_run10
。
我可以使用循环导入它们吗?类似于:i=1 to 10, df_runi=pandas.read_csv('data_runi_all.csv')
。
我在问,因为每个数据框的数据分析,绘图等也是一样的。每个数据帧的所有代码重复10次。如果我可以使用循环执行10次,则代码将更短且可读。
答案 0 :(得分:3)
循环阅读您的CSV并致电pd.concat
:
file_name = 'data_run{}_all.csv'
df_list = []
for i in range(1, 11):
df_list.append(pd.read_csv(file_name.format(i))
df = pd.concat(df_list)
或者,您可以在理解中构建列表:
file_name = 'data_run{}_all.csv'
df = pd.concat([pd.read_csv(file_name.format(i)) for i in range(1, 11)])
答案 1 :(得分:0)
您需要将df_run
列入清单。你可以这样做:
df_run = []
for i in range(1,10):
df_run.append(pandas.read_csv('data_run{0}_all.csv'.format(i))
for df in df_run:
// Do your processing
或者在一个循环中完成所有操作,并避免使用列表。