任何人都可以在下面提供帮助吗? 我正在使用Titanic Dataset,我已经完成了所有数据预处理。现在我需要1)创建不同的模型 2)针对不同模型的超级参数上的GridSearchCV 3)评估并选择具有最佳参数的最佳模型。
# Spot Check Algorithms
models=[]
models.append(('gaussian',GaussianNB()))
models.append(('logreg',LogisticRegression()))
models.append(('svc',SVC()))
models.append(('linear_svc',LinearSVC()))
models.append(('perceptron',Perceptron()))
models.append(('decisiontree',DecisionTreeClassifier()))
models.append(('randomforest',RandomForestClassifier()))
models.append(('knn',KNeighborsClassifier()))
models.append(('gbk',GradientBoostingClassifier()))
models.append(('xgb',XGBClassifier()))
# evaluate each model in turn
Model=[]
Accuracy=[]
SD=[]
model_score = pd.DataFrame()
for name, model in models:
gen=model.fit(x_train,y_train)
scores = cross_val_score(gen, x_train, y_train, cv=10)
acc=round(scores.mean()*100,2)
sd=round(scores.std() * 2,2)
Model.append(name)
Accuracy.append(acc)
SD.append(sd)
Models_Accuracy = pd.DataFrame({'Model' : Model,
'Accuracy' : Accuracy,
'SD' : SD } )
Models_Accuracy.sort_values(by='Accuracy',ascending=False)