我正在使用一个数据框。如果数据框中的列中有一定百分比的空白,我想将该列追加到字典中(并最终将该字典变成新的数据框)。
features = {}
percent_is_blank = 0.4
for column in df:
x = df[column].isna().mean()
if x < percent_is_blank:
features[column] = ??
new_df = pd.DataFrame.from_dict([features], columns=features.keys())
“ ??”中会发生什么
答案 0 :(得分:1)
我认为最好用DataFrame.loc
进行过滤:
new_df = df.loc[:, df.isna().mean() < percent_is_blank]
在您的解决方案中可以使用:
for column in df:
x = df[column].isna().mean()
if x < percent_is_blank:
features[column] = df[column]