CSV读取特定列,如果不存在,则输入NaN

时间:2018-10-01 01:44:57

标签: python pandas csv

我有一些CSV文件,必须从中读取一些特定数据(列),但是问题是某些文件根本没有这些列。由于我试图弄清数据的质量并检查这些丢失的数据,因此,只要我在文件中根本找不到列,就希望能够创建它并用NaN填充它。

有没有办法在python中做到这一点?熊猫?

预先感谢您的帮助

1 个答案:

答案 0 :(得分:0)

假设您已将所有csv文件读入dataframe,

l=[df1,df2,...]


d={x: y.reset_index(level=0,drop=True) for x , y in pd.concat(l,keys=range(len(l))).groupby(level=0)}

然后您可以通过

访问df
d[0]