coef_
存储什么?
coef_
源自尝试完成特征选择时的套索回归方法
答案 0 :(得分:0)
它存储parameter vector,描述您乘以每个特征以得到预测值的权重。本质上,coef_
是模型的参数(不包括正则化和截距(w0)项-参见下文)。
使用套索回归时,您将使用正则化执行线性回归。 如果不进行正则化,则给定实例的预测值的形式为:
y = w0 + w1 * x1 + w2 * x2 +…+ wn * xn
其中y是您的预测值,参数向量是 w = [w0,w1,w2,...,wn],而训练实例的特征向量是 x < / strong> = [x1,x2,...,xn]。在执行回归时,您正在更改参数向量(或“权重向量”)的值以获得预测值,该预测值将预测值与目标值之间的差异最小化。这是通过最小化成本函数(衡量您的预测与真实值相差多少)来实现的。
(套索)正则化的使用只需将参数向量的l1范数添加到成本函数(您将其最小化)中,这有助于保持特征向量的值尽可能小。