过采样和上采样之间以及SMOTE和over_sampling.SMOTE之间的区别?

时间:2018-01-26 10:55:45

标签: python python-3.x scikit-learn resampling imblearn

这个问题有些偏执,就像谷歌搜索结果因音频和傅立叶变换等而混杂在一起。

  1. 特别是对于python,当谈到数字数据时,少数类的过采样和上采样之间是否存在差异?

  2. 我正在使用imblearn对少数类进行过采样/上采样。我目前正在使用

    from imblearn.over_sampling import SMOTE
    
    sm = SMOTE(random_state=12, ratio = 1.0)
    x_train_res, y_train_res = sm.fit_sample(X_train, y_train)
    

    但最近,我遇到了

    sm = over_sampling.SMOTE(random_state=12, ratio = 1.0)
    x_train_res, y_train_res = sm.fit_sample(X_train, y_train)
    

    有什么区别?

1 个答案:

答案 0 :(得分:0)

from imblearn.over_sampling import SMOTE

sm = SMOTE(random_state=12, ratio = 1.0)

import imblearn.over_sampling 

sm = over_sampling.SMOTE(random_state=12, ratio = 1.0)

相同。唯一的区别是您如何访问代码中的SMOTE函数。