如何使用随机森林ML

时间:2020-01-13 18:30:12

标签: python machine-learning

我必须预测2020年澳大利亚公开赛的获胜者。我的数据集具有以下特征:位置/比赛/日期/系列/法院/表面/回合/获胜者/失败者等。

我仅使用以下功能训练了我的模型:“胜利”,“系列”,“法院”,“表面”,“ WinRank”,“ LoseRank”,“ WPts”,“ LPts”,“ Wsets”,“ Lsets” ,“天气”,我的准确度是0.93,但现在我必须预测获胜者的名字,而且我不知道如何根据我训练的模型来做。

示例:如果我有使用随机森林的Dimitrov G. vs Simion G,则该模型必须给我一个作为比赛的获胜者。

我用虚拟变量转换了玩家的名字,但是之后,我不知道该怎么办?

谁能给我一个我如何预测获胜者的想法?我可以创建一个锦标赛吗?

1 个答案:

答案 0 :(得分:0)

为解决此类问题,我建议创建一个自定义目标变量。 首先,将玩家的名字转换为虚拟变量似乎是合理的(只需确保以相同的名字和姓氏组合来标识唯一的玩家,从而避免重复,从而为玩家的名字提供正确的虚拟代码)。 / p>

现在,创建目标变量“ wins”-

  1. 使用比赛的两个球员名称-P1,P2作为模型的输入特征。
  2. 如果P1获胜,则将“获胜”定义为1,如果P2获胜,则将其定义为0。
  3. 以此设置运行模型。
  4. 当您要创建比赛并预测获胜者时,输入的内容将是您的2位玩家和其他比赛功能。如果“获胜”接近1,则表示您的P1获胜并输出该玩家的姓名。