重新定义或覆盖sklearn中的metaestimators?

时间:2018-03-09 07:13:34

标签: python pandas oop scikit-learn

我正在编写自定义sklearn管道。

我需要它才能处理pandas数据帧。 如果我通过创建内置

的子类来创建自定义变换器和估算器
BaseEstimator, ClassifierMixin,TransformerMixin 

在拟合/转换函数期间,当精确调用_check_X_y时,所有这些类都会自动将数据帧强制转换为numpy.ndarray。

我知道https://github.com/scikit-learn-contrib/sklearn-pandas的存在,但是根据两个不稳定库之间的不稳定绑定不是一种选择。

因此,我实现了我的估算器而没有继承BaseEstimator, ClassifierMixin, TransformerMixin中的任何内容,只是定义了api fit(),fit_transform(),transform(),_get_params(),_set_params()请求的方法。 对我而言,它似乎完美无缺,也与GridSearchCV结合使用。

我只能在需要时将df转换为numpy

我的问题是:我有什么理由不这样做吗? 我是否会错过任何隐藏的sklearn API要求?

0 个答案:

没有答案