TomekLinks fit_sample(X,y)花费大量时间

时间:2019-05-08 14:43:10

标签: python-3.x nlp imblearn

我正在研究文本分类问题。我正在使用imblearn模块的TomekLinks类对数据重新采样。但是,即使我等待30分钟,调用TomekLinks类程序的fit_sample(X,y)方法后也不会执行任何操作。 我的数据集是1800000个记录(文本数据)。这是代码段

从imblearn.under_sampling导入TomekLinks

tl = TomekLinks(return_indices = True,比率='多数',random_state = 42) X_tl,y_tl = tl.sample(train_x,y_binary)

有人能帮忙为什么要花这么长时间?

另外,当我单独执行tl.fit()时,它会在几秒钟内完成,但是当我调用tl.sample()方法时,会出现错误,即TomekLinks中没有名为sample的属性

0 个答案:

没有答案