我想使用GridSearchCV来确定分类器的参数,使用管道似乎是一个不错的选择。
该应用程序将使用Bag-of-Word功能进行图像分类,但问题是根据是否使用训练或测试示例,存在不同的逻辑管道。
对于每个训练集,KMeans必须运行以生成将用于测试的词汇表,但对于测试数据,不运行KMeans进程。
我看不出如何为管道指定行为差异。
答案 0 :(得分:3)
您可能需要从KMeans
类派生并重写以下方法以使用词汇逻辑:
fit_transform
只会在火车数据上调用
transform
也许班级推导不是最好的选择。您还可以编写自己的变换器类来包装对嵌入式KMeans模型的调用,并提供fit
类所需的fit_transform
/ transform
/ Pipeline
API。第一阶段。