我有一个不平衡的训练数据,我在weka中使用逻辑回归进行分类。
有两个班级好坏。好有75000个实例和坏 我的测试数据有10000个好数据。
当我训练时,它更倾向于获得良好的数据,即它几乎将所有不良实例分类为好。我该怎么办 ? 我试图在训练数据中有10000个好实例,而不是75000,但问题仍然是相同的。
答案 0 :(得分:0)
不确定python但是在gui版本中你可以使用SpreadSubsample来减少类不平衡。如果你觉得那么糟糕'这是一个很好的代表,然后你可以尝试不同数量的好的实例。'
要执行此操作,您需要选择过滤器==>监督==>实例==> SpreadSubsample ==>使用' max count'
更改实例数答案 1 :(得分:0)
您可以尝试一些事情。