将Python中的不平衡数据集拆分为测试集和训练集后,我想对数据进行二次采样。但是我得到了很高的精度,我也得到了 出现以下错误:
/usr/local/lib/python3.5/dist-packages/ipykernel_launcher.py:33: UserWarning: Boolean Series key will be reindexed to match DataFrame index.
我需要为此担心吗?在我的数据集中,我有2724 0和351 1。我用于对数据进行下采样的代码如下:
df_majority = x_train[df_x.A==0]
df_minority = x_train[df_x.A==1]
df_majority_downsampled = resample(df_majority, replace=False, n_samples=351, random_state=123)
df_downsampled = pd.concat([df_majority_downsampled, df_minority])
样本数据:
x A LA LO
1 0 -42.3333。 72.4567
2 1 -42.4500 72.2345
3 0 -42.2345 72.0000
4 0 -42.9090 72.7897
5 0 -42.7777 72.1234
我想预测A