在单个管道中组合标记和未标记的数据

时间:2013-12-17 20:38:46

标签: scipy scikit-learn dbn

我正在构建使用DBN进行要素学习和逻辑回归来微调结果网络的图像分类器。通常,在SciKit Learn中实现此类体系结构的最方便方法是使用Pipeline类。但在我的情况下,我有~10K未标记的图像,只有约300个标记的图像。当然,我想使用所有图像训练DBN并使用仅标记示例进行逻辑回归。

我可以考虑实现我自己的Pipeline类来处理这种情况,但首先我想知道是否已存在某些东西。是吗?

1 个答案:

答案 0 :(得分:2)

目前的scikit-learn Pipeline API不适合使用无人监督的预训练进行监督学习。实现自己的包装类可能是推进该案例的最佳方式。