下采样时出错:UserWarning:布尔系列键将被重新索引以匹配DataFrame索引

时间:2018-06-30 08:47:14

标签: python pandas

将Python中的不平衡数据集拆分为测试集和训练集后,我想对数据进行二次采样。但是我得到了很高的精度,我也得到了 出现以下错误:

/usr/local/lib/python3.5/dist-packages/ipykernel_launcher.py:33: UserWarning: Boolean Series key will be reindexed to match DataFrame index.

我需要为此担心吗?在我的数据集中,我有2724 0和351 1。我用于对数据进行下采样的代码如下:

df_majority = x_train[df_x.A==0]    
df_minority = x_train[df_x.A==1]    
df_majority_downsampled = resample(df_majority, replace=False, n_samples=351, random_state=123)    
df_downsampled = pd.concat([df_majority_downsampled, df_minority])

样本数据:

x A LA LO

1 0 -42.3333。 72.4567

2 1 -42.4500 72.2345

3 0 -42.2345 72.0000

4 0 -42.9090 72.7897

5 0 -42.7777 72.1234

我想预测A

0 个答案:

没有答案