我对解决机器学习问题感兴趣,因此我使用lightgbm对其进行了预测。但是它训练的迭代次数越多,效果就越差。听起来像过拟合。事实是数据为1920000 X 40,lightgbm需要一些迭代来训练。
因此,我遵循了官员提供的建议。 但是情况没有变好。
enter image description here 如果有人能告诉我原因是什么,将不胜感激!
答案 0 :(得分:0)
在看不到数据和EDA结果的情况下,我们无法告诉您为什么过拟合。如果要进行参数调整,这就是答案。
摘自官方文档:
过度拟合交易
max_bin
num_leaves
使用min_data_in_leaf
并
min_sum_hessian_in_leaf
bagging_fraction
和
bagging_freq
按集合feature_fraction
使用功能子采样lambda_l1
,lambda_l2
和min_gain_to_split
进行正则化max_depth
以避免
正在生长的深树