Question

我有一些CSV文件，必须从中读取一些特定数据（列），但是问题是某些文件根本没有这些列。由于我试图弄清数据的质量并检查这些丢失的数据，因此，只要我在文件中根本找不到列，就希望能够创建它并用NaN填充它。

有没有办法在python中做到这一点？熊猫？

预先感谢您的帮助

Answer 1

假设您已将所有csv文件读入dataframe，

l=[df1,df2,...]


d={x: y.reset_index(level=0,drop=True) for x , y in pd.concat(l,keys=range(len(l))).groupby(level=0)}

然后您可以通过

访问df

d[0]