我如何在Scikit-learn中使用RandomizedLogisticRegression?

时间:2013-11-27 15:30:37

标签: scikit-learn logistic-regression

我根本无法理解此课程的documentation。 我可以使用它来拟合数据,并获得特征的分数,但是这个类应该是这个吗?

我无法看到如何使用它来实际使用适合的模型执行回归。上面文档中的示例只是创建一个类的实例,所以我看不出它应该如何帮助。

有些方法可以执行'transform'操作,但没有提到什么样的转换。

是否可以使用此类来获取新测试数据的实际预测,是否可以在交叉折叠验证中使用它来比较我正在使用的其他方法的性能?

我在其他分类器中使用了排名最高的功能,但我不确定使用此分类器是否可以实现更多功能。

更新:我在文档的feature selection部分找到了fit_transform的用法:

  

当目标是减少要与另一个分类器一起使用的数据的维度时,他们会公开一种变换方法来选择非零系数

除非我得到一个说我错了的答案,否则我会假设这个分类器确实不做预测。我会在回答自己的问题之前等待。

1 个答案:

答案 0 :(得分:8)

随机LR应该是一种特征选择方法,而不是分类器本身。它的API与标准的scikit-learn变换器相匹配:

randomlr = RandomizedLogisticRegression()
X_train = randomlr.fit_transform(X_train)
X_test = randomlr.transform(X_test)

然后将模型拟合到X_train并像往常一样对X_test进行分类。