我的数据如下所示
df.head()
name location duration month status
aim bgy 12 active
terra pm 3 inactive
jerry bgy 23 inactive
finn dm 8 active
pearl bgy 21 active
doe pm 9 inactive
pearl pm 11 inactive
我有大约2000个数据点,并且有大约6个唯一的位置名称。我需要在给定任何名称,位置,当前持续时间详细信息的情况下构建/训练一个预测模型,该模型应以概率%预测状态(有效/无效)
因此,如果此模型的输入为
name location duration month
jim bgy 6
tim pm 9
sara bgy 12
我应该得到类似
的结果name location duration month status active_probability
jim bgy 6 active 0.9
tim pm 9 inactive 0.0
sara bgy 12 active 0.8
答案 0 :(得分:0)
您可以尝试使用LightGBM。它非常易于使用,并且运行速度非常快。