使用类不平衡数据集进行训练

时间:2016-10-18 19:00:31

标签: r machine-learning

我有一个包含50个正数和950个负数的数据集。我使用带有SMOTE的Logistic回归,使用10倍交叉验证得到69%的AUC。如何提高性能?

1 个答案:

答案 0 :(得分:1)

如果您没有使用偏差项,正则化,并使用验证集设置正则化参数,则应该执行这些操作。除此之外,你正在进入模型选择和特征工程的丛林。