我有一个数据框,要为其创建一列以表示数据框中的缺失值模式。例如:
例如CSV文件
A,B,C,D
1,NaN,NaN,NaN
Nan,2,3,NaN
3,2,2,3
3,2,NaN,3
3,2,1,NaN
我想创建列E,该列具有以下方式的值: 如果A,B,C,D全部缺失E = 4, 如果所有A,B,C,D都存在E = 0, 如果A和B仅缺少此类E = 1,则E的编码不必像我提到的只是模式指示。我如何在熊猫中遇到这个问题?
答案 0 :(得分:3)
结合使用isnull
和sum(axis=1)
示例:
import pandas as pd
df = pd.DataFrame({'A': [1, None, 3, 3, 3],
'B':[ None, None, 1, 1, 1]})
df['C'] = df.isnull().sum(axis=1)