我想使用scikit-learn GridSearchCV来学习由PCA和KernelDensity组成的管道的参数值,这应该提供可能的表达功能来对新样本进行评分或分类。
使用分类器或回归器扩展此类管道似乎是扩展评估的合理步骤,但是,由于KernelDensity不提供transform
方法,因此会发生TypeError。仅使用PCA和KernelDensity在管道上进行网格搜索,然后使用带有选定标签grid.fit(X_train)
的数据子集进行计算。
有没有一种构建扩展管道的方法,该方法首先将PCA应用于降低输入向量的维数,然后将KernelDensity拟合到数据上(可能仅具有特定标签的子集),然后在最后一步中使用分类器在GridSearchCV grid.search(X_train,y_train)
中测量性能还是用另一种方法获得最佳PCA和KernelDensity参数,以支持基于内核密度估计值的分类?