我必须预测2020年澳大利亚公开赛的获胜者。我的数据集具有以下特征:位置/比赛/日期/系列/法院/表面/回合/获胜者/失败者等。
我仅使用以下功能训练了我的模型:“胜利”,“系列”,“法院”,“表面”,“ WinRank”,“ LoseRank”,“ WPts”,“ LPts”,“ Wsets”,“ Lsets” ,“天气”,我的准确度是0.93,但现在我必须预测获胜者的名字,而且我不知道如何根据我训练的模型来做。
示例:如果我有使用随机森林的Dimitrov G. vs Simion G,则该模型必须给我一个作为比赛的获胜者。
我用虚拟变量转换了玩家的名字,但是之后,我不知道该怎么办?
谁能给我一个我如何预测获胜者的想法?我可以创建一个锦标赛吗?
答案 0 :(得分:0)
为解决此类问题,我建议创建一个自定义目标变量。 首先,将玩家的名字转换为虚拟变量似乎是合理的(只需确保以相同的名字和姓氏组合来标识唯一的玩家,从而避免重复,从而为玩家的名字提供正确的虚拟代码)。 / p>
现在,创建目标变量“ wins”-