添加"外部"管道

时间:2015-10-20 09:37:54

标签: scikit-learn

我想撰写文本文本的pipleline。但是有一个 管道中的额外步骤"外部"功能已添加。这些 功能存储在外部数据库中,可通过文档ID访问 (输入中的行号)。

自定义管道阶段在tfidf步骤之后。意思是输入到 阶段将是一个稀疏矩阵。有没有办法让我通过索引 输入矩阵也是?或者也许是在两者之间传递一些元数据的通用方法 管道阶段?

请注意,管道的输入由GridSearchCV选择。

我看到了Feature Union with Heterogeneous Data Sources,但未能看到如何将其应用于我的情况,因为我无法计算从输入到舞台的功能。

0 个答案:

没有答案