我有一些CSV文件,必须从中读取一些特定数据(列),但是问题是某些文件根本没有这些列。由于我试图弄清数据的质量并检查这些丢失的数据,因此,只要我在文件中根本找不到列,就希望能够创建它并用NaN填充它。
有没有办法在python中做到这一点?熊猫?
预先感谢您的帮助
答案 0 :(得分:0)
假设您已将所有csv文件读入dataframe,
l=[df1,df2,...]
d={x: y.reset_index(level=0,drop=True) for x , y in pd.concat(l,keys=range(len(l))).groupby(level=0)}
然后您可以通过
访问df
d[0]