Question

我有两个X和Y列，它们是文本列。 X是我的特征，Y是我的目标变量。我的Y变量由NaN个值组成。我想将Y的NaN值分成一个单独的数据框，以便在测试数据集中使用它们。

   Y
1. aaa
2. bbb
3. ccc
4. NaN
5. NaN
6. ddd

谁能告诉我如何分隔NaN行？

Answer 1

mask = df['Y'].isna()
#oldier pandas versions
#mask = df['Y'].isnull()
#DataFrame with NaNs
df1 = df[mask]
#DataFrame with no NaNs
df2 = df[~mask]