我指的是上下文link to Feature Transformation using tree ensembles。
具体对于下面的代码部分,在链接的样本中,(1)使用Boosting树生成特征,然后使用LR训练,使用Boosting树本身优于(2)的方法。问题,
还想知道为什么使用Boosting树生成特征,然后用LR训练,优于使用Boosting树本身?
grd = GradientBoostingClassifier(n_estimators=n_estimator)
grd_enc = OneHotEncoder()
grd_lm = LogisticRegression()
grd.fit(X_train, y_train)
grd_enc.fit(grd.apply(X_train)[:, :, 0])
grd_lm.fit(grd_enc.transform(grd.apply(X_train_lr)[:, :, 0]), y_train_lr)