输入用于机器学习的数据

时间:2019-07-24 14:31:55

标签: machine-learning neural-network lightgbm

我是神经网络的新手,我对输入数据有疑问(使用LightGbm算法)

问题在于我的输入数据为95%的负数,而只有5%的正数(我有兴趣寻找积极的数据)

使用此数据时,AUC为0.55时,我的准确度为95.5%。在我的新数据测试中,正确地猜出了0/5。

在测试3中,我尝试制作一个阴性数据量同样为正值(相应地,数据量减少)的样本后,准确度为75%,AUC得分为0.7。推测有/ 5项积极数据

我认为,由于我正在针对大多数负面数据训练我的模型,因此这导致该模型从不学习如何正确识别正面信息。如何处理班级不平衡的问题?

0 个答案:

没有答案