我正在运行GridSearch CV来优化scikit中分类器的参数。一旦完成,我想知道哪些参数被选为最佳参数。
每当我这样做时,我会得到AttributeError: 'RandomForestClassifier' object has no attribute 'best_estimator_'
,并且无法说明原因,因为它似乎是documentation上的合法属性。
from sklearn.grid_search import GridSearchCV
X = data[usable_columns]
y = data[target]
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=0)
rfc = RandomForestClassifier(n_jobs=-1,max_features= 'sqrt' ,n_estimators=50, oob_score = True)
param_grid = {
'n_estimators': [200, 700],
'max_features': ['auto', 'sqrt', 'log2']
}
CV_rfc = GridSearchCV(estimator=rfc, param_grid=param_grid, cv= 5)
print '\n',CV_rfc.best_estimator_
收益率:
`AttributeError: 'GridSearchCV' object has no attribute 'best_estimator_'
答案 0 :(得分:60)
在获得最佳参数组合之前,您必须先拟合数据。
from sklearn.grid_search import GridSearchCV
from sklearn.datasets import make_classification
from sklearn.ensemble import RandomForestClassifier
# Build a classification task using 3 informative features
X, y = make_classification(n_samples=1000,
n_features=10,
n_informative=3,
n_redundant=0,
n_repeated=0,
n_classes=2,
random_state=0,
shuffle=False)
rfc = RandomForestClassifier(n_jobs=-1,max_features= 'sqrt' ,n_estimators=50, oob_score = True)
param_grid = {
'n_estimators': [200, 700],
'max_features': ['auto', 'sqrt', 'log2']
}
CV_rfc = GridSearchCV(estimator=rfc, param_grid=param_grid, cv= 5)
CV_rfc.fit(X, y)
print CV_rfc.best_params_
答案 1 :(得分:1)
只需再添加一点就可以清楚了。
该文件说明如下:
best_estimator_:estimator或dict:
通过搜索选择的估算器,即估算器,其在左数据上给出最高分(或如果指定的最小损失)。
当使用各种参数调用网格搜索时,它会根据给定的记分器func选择分数最高的网格搜索。最佳估算器提供导致最高分的参数信息。
因此,只能在拟合数据后才能调用它。