响应和预测的长度必须相同。准确性误差

时间:2019-05-04 22:59:42

标签: r oversampling

我正在处理大量贷款数据集,这是我项目的一部分 https://www.kaggle.com/lorenzopagliaro01/lending-club-loans-analysis/data。 方法是使用多项式回归模型,因为我的因变量是多项类别类型(即,全额付款,冲销,当期,15到31晚和31到120晚)。但是,由于数据分布不平衡而在早期出现了问题,其中31-120后期占很小的比例,而Current占很大的比例。现在寻求探索R.中的过采样方法。在多项式回归过采样中使用ROSE库的指导性/方向。我已经看到了二项式过采样的示例,但是它并不是很有用。如果您可以引导我朝基于R的多项式示例的方向前进,那就太好了

0 个答案:

没有答案