在以下语句中:df_clean = df.loc[df['time'] < upper_bound]
从函数中删除异常值(upper_bond
)。
但是,输出将从df
中删除所有空值,我需要保留所有空值。
是否有另一种写方法来保留空值?
答案 0 :(得分:3)
如果要根据多个条件进行过滤,则可以使用一元or
运算符|
对它们进行过滤,由于运算符的优先级,可以使用括号()
将条件括起来。
df_clean = df.loc[(df['time'] < upper_bound) | (df['time'].isnull())]
因此,我们在此处添加条件isnull
,以将NaN
或NaT
值包括在最终的已过滤df中。
答案 1 :(得分:0)
df_clean = df.loc[(df['time'] < upper_bound) | (df["time"].isnull())]