Scikit-learn允许将样本权重提供给线性,逻辑和脊回归(以及其他),但不能提供弹性网或套索回归。通过样本权重,我的意思是输入的每个元素(和相应的输出)具有不同的重要性,并且应该对与其权重成比例的估计系数产生影响。
在将数据传递给ElasticNet.fit()以合并我的样本权重之前,有没有办法可以操作我的数据?
如果没有,是否存在不可能的根本原因?
谢谢!
答案 0 :(得分:5)
您可以在sklearn' issue-tracker中阅读有关此内容的一些讨论。
它的基本内容如下:
正如你在这个帖子和linked one about adaptive lasso中看到的,那里没有太多的活动(可能是因为没有多少人关心,相关的论文不够流行;但这只是一个猜测)
根据你的具体任务(大小?稀疏度?),你可以很容易地基于scipy.optimize构建自己的优化器,支持这种样本权重(这会慢一点,但又健壮又精确)!