森林随机结果差

时间:2020-02-13 11:32:18

标签: performance

我试图弄清楚为什么我的模型在看不见的数据上表现如此差。数据集是关于一家银行的,该银行开始了一项活动,并想弄清楚被叫人是否成为客户。因此,我尝试了一些功能转换,包括OneHot和Dummyvariable,之后,我通过随机搜索来搜索最佳超参数,并通过F1评分对结果进行评分。我知道其中没有功能工程,因为这只是初稿。但是该模型在测试数据上的最佳结果约为49%。那很糟糕,我不知道为什么。非常令人惊讶的是,在将目标拟合到管道并查找“重要性”之后,目标被标记为特征。

https://colab.research.google.com/drive/1IlGJ2aItwFCMQ8oVsQHw6-5mlXP_17Gc

问候 腕带

0 个答案:

没有答案