以下是数据框的子集:
id words A B C D E
1 new 1 1
2 good 1
3 star 1
4 never
5 final
如果所有其他变量(列)的值为" null",我想将新变量(称为FF)定义为新列并为其分配1。新数据框将是这样的:
id words A B C D E FF
1 new 1 1
2 good 1
3 star 1
4 never 1
5 final 1
我如何使用python和Pandas来做到这一点?谢谢。
答案 0 :(得分:6)
您可以定义一个逐行应用于数据框的函数:
def fill_if_nan(row):
if row[['A', 'B', 'C', 'D', 'E']].isnull().all():
return 1
return None
df['FF'] = df.apply(fill_if_nan, axis=1)
或者更优雅的基于numpy的解决方案:
df['FF'] = np.where(df[['A', 'B', 'C', 'D', 'E']].isnull().all(1), 1, np.nan)