我正在使用GridsearchCV
来调整超参数,现在我想在训练和验证步骤中进行最小最大值Normalization(StandardScaler())
。但是我想我不能这样做。
问题是:
GridsearchCV
来调整参数答案 0 :(得分:0)
实际上,这会导致数据泄漏,很好地抓住了它!
使用管道解决此问题的一种方法是,以StandardScaler作为管道中的第一个操作,然后再选择您的分类器,最后将该管道传递给GridSearchCV,以建立管道
clf = make_pipeline(StandardScaler(),
MyClassifier())
grid_search = GridSearchCV(clf, refit=True)
有关更多信息,请查看这篇文章here