R的不平衡比率?

时间:2015-10-27 03:00:22

标签: r

我有很多不平衡的数据集,我正在用SMOTE等算法来平衡它们。所有数据都是回归数据。为了比较前后的数据,我需要计算不平衡比率这些回归数据。

我搜索了很多但是徒劳无功。我在R语言工作。

如何计算R语言中回归数据集的不平衡比? 二进制数据的IR(不平衡比率)=多数类实例中没有/少数类实例中没有

1 个答案:

答案 0 :(得分:1)

假设您的问题是二进制分类,而数据集df有一个名为Class的列,您可以使用这样的函数来计算不平衡比率:

getIMR <- function(df){
    minCl <- names(which.min(table(df$Class)))
    sum(df$Class!=minCl)/sum(df$Class==minCl)
}

请注意,我假设不平衡比率的定义为N_majority/N_minority