计算多类数据集的失衡率

时间:2019-01-24 08:34:00

标签: python dataset data-mining data-science

如何为不平衡的数据集计算不平衡率?我遇到了一种定义方式(摘自论文):

  

由不平衡率(IR)定义,即不平衡率(IR),即不占多数的实例数量与不占少数的实例数量之比

现在,这是正确的计算方法之一吗?

谢谢

1 个答案:

答案 0 :(得分:0)

IR =(negative_class / positive_class)

其中positive_class是少数类别样本的数量,negative_class是多数类别样本的数量。