Question

所以我正在理解套索回归，我不明白为什么当它只是二维回归时，为什么需要两个输入值来预测另一个值。

在文档中说

clf.fit([[0,0], [1, 1], [2, 2]], [0, 1, 2])

我不明白。为什么是[0,0]或[1,1]而不是[0]或[1]？

Answer 1

[[0,0], [1, 1], [2, 2]]

意味着您有3个样本/观测值，每个样本都有2个特征/变量（二维）。

的确，您可以将这3个样本仅包含1个特征/变量，并且仍然能够拟合模型。

使用1个功能的示例。

from sklearn import datasets
from sklearn import linear_model

# import some data to play with
iris = datasets.load_iris()
X = iris.data[:, :1]  # we only take the feature
y = iris.target

clf = linear_model.Lasso(alpha=0.1)

clf.fit(X,y)

print(clf.coef_)
print(clf.intercept_)

仅使用一个特征/变量训练/拟合sklearn中的线性回归

1 个答案:

的确，您可以将这3个样本仅包含1个特征/变量，并且仍然能够拟合模型。