我有一个数据集,其中已经提到了标签,即客户是否以1和0的形式违约。我想计算可能违约的客户的概率。没有测试数据集。我只有一个数据集,因此只需要训练我的模型并告诉客户可以违约的概率。我该怎么办?
通常,我只是在训练集上训练模型并在测试集上对其进行测试,但是这里的问题有所不同,因为没有测试数据。
答案 0 :(得分:-1)
您将训练数据分解为70:30
的比例,然后将较大的一个训练为数据集,将较小的一个作为测试数据集。
对于这种类型的问题,最常用的算法是使用Logistic regression
进行训练。