我有多个名为df1,df2...df100
的数据框。我想创建一个名为file的新列,并在每个文件中填充其文件名。例如。 df1['file'] = 'df1'
为所有数据帧循环。
答案 0 :(得分:0)
使用字典表示可变数量的变量
明确命名可变数量的变量是不好的做法。你应该使用字典。例如,给定100个数据帧,其中包含从文件中读取的数据:
dfs = {f : pd.read_csv(f) for f in file_paths}
通过此设置,您还可以通过pd.DataFrame.assign
轻松地在新系列中添加文件名:
dfs = {f : pd.read_csv(f).assign(file=f) for f in file_paths}