所以我正在理解套索回归,我不明白为什么当它只是二维回归时,为什么需要两个输入值来预测另一个值。
在文档中说
clf.fit([[0,0], [1, 1], [2, 2]], [0, 1, 2])
我不明白。为什么是[0,0]
或[1,1]
而不是[0]
或[1]
?
答案 0 :(得分:0)
[[0,0], [1, 1], [2, 2]]
意味着您有3个样本/观测值,每个样本都有2个特征/变量(二维)。
使用1个功能的示例。
from sklearn import datasets
from sklearn import linear_model
# import some data to play with
iris = datasets.load_iris()
X = iris.data[:, :1] # we only take the feature
y = iris.target
clf = linear_model.Lasso(alpha=0.1)
clf.fit(X,y)
print(clf.coef_)
print(clf.intercept_)