因此,Sci-kit中的一些模型学习如Logistic回归支持我大量使用的predict_proba方法。对于像Lasso这样的模型,是否还有其他方法可以输出类似的概率数组,因为它们不支持predict_proba?
另外:我正在使用三个结果数据集,其中结果之间的概率可以相对均匀 - 任何针对模型/调整的一般建议,以尝试提高概率精度,可以处理50多个特征列? =)
谢谢!
答案 0 :(得分:1)
Sklearn完全为此目的介绍了Probability calibration。在没有自然概率输出的情况下改进或增加对分类器的支持。
此处还有一个blog-post。
用法将基于CalibratedClassifierCV。
在这两种方法中, sigmoid 和等渗,前者作为libsvm概率输出背后的基础方法非常受欢迎,你可以在sklearn的包装SVC