Python使用管道创建不同的模型,对每个模型进行gridsearchCV并选择最佳模型

时间:2018-07-16 19:32:17

标签: python pipeline

任何人都可以在下面提供帮助吗? 我正在使用Titanic Dataset,我已经完成了所有数据预处理。现在我需要1)创建不同的模型 2)针对不同模型的超级参数上的GridSearchCV 3)评估并选择具有最佳参数的最佳模型。

# Spot Check Algorithms
models=[]
models.append(('gaussian',GaussianNB()))
models.append(('logreg',LogisticRegression()))
models.append(('svc',SVC()))
models.append(('linear_svc',LinearSVC()))
models.append(('perceptron',Perceptron()))
models.append(('decisiontree',DecisionTreeClassifier()))
models.append(('randomforest',RandomForestClassifier()))
models.append(('knn',KNeighborsClassifier()))
models.append(('gbk',GradientBoostingClassifier()))
models.append(('xgb',XGBClassifier()))
# evaluate each model in turn
Model=[]
Accuracy=[]
SD=[]
model_score = pd.DataFrame()
for name, model in models:
gen=model.fit(x_train,y_train)
scores = cross_val_score(gen, x_train, y_train, cv=10)
acc=round(scores.mean()*100,2)
sd=round(scores.std() * 2,2)
Model.append(name)
Accuracy.append(acc)
SD.append(sd)
Models_Accuracy = pd.DataFrame({'Model' : Model,
                            'Accuracy' : Accuracy,
                            'SD' : SD } )
Models_Accuracy.sort_values(by='Accuracy',ascending=False)

0 个答案:

没有答案