我有很多不平衡的数据集,我正在用SMOTE等算法来平衡它们。所有数据都是回归数据。为了比较前后的数据,我需要计算不平衡比率这些回归数据。
我搜索了很多但是徒劳无功。我在R语言工作。
如何计算R语言中回归数据集的不平衡比? 二进制数据的IR(不平衡比率)=多数类实例中没有/少数类实例中没有
答案 0 :(得分:1)
假设您的问题是二进制分类,而数据集df
有一个名为Class
的列,您可以使用这样的函数来计算不平衡比率:
getIMR <- function(df){
minCl <- names(which.min(table(df$Class)))
sum(df$Class!=minCl)/sum(df$Class==minCl)
}
请注意,我假设不平衡比率的定义为N_majority/N_minority