根据Pandas中其他列的值为新列分配值

时间:2017-06-18 14:23:00

标签: python pandas

以下是数据框的子集:

id  words  A   B   C   D  E  
1   new    1       1   
2   good   1  
3   star            1
4   never                  
5   final   

如果所有其他变量(列)的值为" null",我想将新变量(称为FF)定义为新列并为其分配1。新数据框将是这样的:

id  words  A   B   C   D  E  FF
1   new    1       1   
2   good   1  
3   star            1
4   never                     1                
5   final                     1

我如何使用python和Pandas来做到这一点?谢谢。

1 个答案:

答案 0 :(得分:6)

您可以定义一个逐行应用于数据框的函数:

def fill_if_nan(row):
    if row[['A', 'B', 'C', 'D', 'E']].isnull().all():
        return 1

    return None

df['FF'] = df.apply(fill_if_nan, axis=1)

或者更优雅的基于numpy的解决方案:

df['FF'] = np.where(df[['A', 'B', 'C', 'D', 'E']].isnull().all(1), 1, np.nan)