我有两个X和Y列,它们是文本列。 X是我的特征,Y是我的目标变量。我的Y变量由NaN
个值组成。我想将Y的NaN
值分成一个单独的数据框,以便在测试数据集中使用它们。
Y
1. aaa
2. bbb
3. ccc
4. NaN
5. NaN
6. ddd
谁能告诉我如何分隔NaN行?
答案 0 :(得分:3)
我认为需要boolean indexing
和isna
:
mask = df['Y'].isna()
#oldier pandas versions
#mask = df['Y'].isnull()
#DataFrame with NaNs
df1 = df[mask]
#DataFrame with no NaNs
df2 = df[~mask]