我正在为二进制分类问题构建一个随机森林分类器。我的标签都是数字。
print labels.unique()
[1 0]
print type(labels)
<class 'pandas.core.series.Series'>
print labels.shape
(3000,)
但是当我使用Gridsearchcv
拟合模型时pipeline = Pipeline(steps=[('scaler', scaler), ('algorithm', algo)])
cv = StratifiedShuffleSplit(labels, 5, test_size=0.25, random_state=42)
gs = GridSearchCV(pipeline, param_grid, cv=cv, scoring='f1')
gs.fit(features, labels)
我收到此错误
ValueError: Unknown label type: 'unknown'
但是当我使用
时gs.fit(features, labels.astype(int))
工作正常。有人让我知道标签中的问题在哪里?
答案 0 :(得分:2)