不平衡数据集中带有网格搜索的随机欠采样的调整率

时间:2019-02-06 16:57:36

标签: python machine-learning scikit-learn gridsearchcv

按照标题上的建议,我想对采样器下我的随机比率进行网格搜索。我想尝试比率10、15和20,其中比率= 10是重新采样的多数阶级/少数种族的人数。

示例:如果少数派有10个元素,则多数派为1000,比率为5,则我将有10个少数派和50个多数派。那就是建议随机抽样的文档的原因。

https://imbalanced-learn.readthedocs.io/en/stable/generated/imblearn.under_sampling.RandomUnderSampler.html

from imblearn.pipeline import make_pipeline as imbalanced_make_pipeline
from sklearn.model_selection import GridSearchCV 

pipe = imbalanced_make_pipeline(RandomUnderSampler(),
                            SMOTE(),
                            RandomForestClassifier())

gsc = GridSearchCV(estimator=pipe, param_grid= {'smote__ratio': [5, 10, 15],
                                            'randomforestclassifier__criterion': ["entropy"], 
                                            'randomforestclassifier__max_depth': np.arange(10,30,5), 
                                            'randomforestclassifier__min_samples_leaf': np.arange(5,15,3)},
               scoring='f1',cv=5, verbose=2)

grid_result = gsc.fit(X, y)

我收到此错误:

AttributeError: 'NoneType' object has no attribute 'items'

有人可以帮助我吗?谢谢。

0 个答案:

没有答案