我有一个关于GridSearchCV
的预处理数据的问题,主要涉及缩放。
所以我希望实现的是:
在StandardScaler()
期间对训练数据进行缩放(例如GridSearchCV
),而不是对包含训练数据和测试数据的整个集合进行缩放。
例如,如果我使用Pipeline
:
clf = make_pipeline(StandardScaler(), GridSearchCV(KerasRegressor(), param_grid = [....], cv=10, refit=True))
我无法选择是否仅在每次折叠过程中将StandardScaler()
应用于训练组->我认为每次折叠都针对整个组进行了缩放。
请问您的建议吗?
谢谢。