这个问题有些偏执,就像谷歌搜索结果因音频和傅立叶变换等而混杂在一起。
特别是对于python,当谈到数字数据时,少数类的过采样和上采样之间是否存在差异?
我正在使用imblearn对少数类进行过采样/上采样。我目前正在使用
from imblearn.over_sampling import SMOTE
sm = SMOTE(random_state=12, ratio = 1.0)
x_train_res, y_train_res = sm.fit_sample(X_train, y_train)
但最近,我遇到了
sm = over_sampling.SMOTE(random_state=12, ratio = 1.0)
x_train_res, y_train_res = sm.fit_sample(X_train, y_train)
有什么区别?
答案 0 :(得分:0)
from imblearn.over_sampling import SMOTE
sm = SMOTE(random_state=12, ratio = 1.0)
和
import imblearn.over_sampling
sm = over_sampling.SMOTE(random_state=12, ratio = 1.0)
相同。唯一的区别是您如何访问代码中的SMOTE函数。