我有一个培训数据集,其中包含大学名称,学生等级,分支机构,大学截止日期。我应该使用哪种预测模型来根据学生的排名,大学门槛和分支机构来预测学生将被录取的大学名单?
我是机器学习的新手。
我希望输出显示的是可以录取学生的大学列表,而不是显示是否为学生分配了大学。
答案 0 :(得分:0)
您的问题可以视为多班分类问题,每所大学都将成为一类。您可以使用简单的随机森林模型并预测每条学生记录的班级概率。由于您正在使用概率,因此模型将返回大学列表以及概率。设置概率阈值,并以高于该阈值的大学作为结果。
答案 1 :(得分:0)
这是一个多类分类问题。如果您是新手,建议您使用基于树的模型,例如随机森林分类器(https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestClassifier.html),如果您从随机森林中获得的结果不够好,请尝试使用Xgboost。它们易于使用,并且在多类分类问题中表现良好。它们还将使您轻松掌握功能的重要性,这也将帮助您解释模型。