我有一个很大的df
events_id score
10234829 34
10234829 0
10234829 98
10234829 24
10234829 78
...
38749228 2
38749228 76
38749228 54
38749228 23
38749228 108
38749228 38
1-我想在Score列上应用RobustScaler()或MinMaxScaler()(或其他缩放器),但我想为每个event_id(不同系列)应用特定的缩放器实例。
2-如何将其插入这种基本管道
model = make_pipeline(StandardScaler(), LogisticRegression())
model.fit(X, y)
...
感谢帮助
Seb