线性回归:需要澄清Coef *特征含义

时间:2016-02-11 11:36:16

标签: machine-learning scikit-learn regression linear-regression

任何人都可以解释我是否拥有从属变量,例如结果(y),由

定义
y = K1*F1 + K2*F2 + ... + Kn*Fn + E

每个特征,其中K - 系数,F - 特征(分类和连续),E - 错误

那是否意味着K1*F1是每1个特征的结果?

1 个答案:

答案 0 :(得分:1)

简答: 是的,这意味着什么(如果你不考虑E)。

长答案: 请参阅下面我刚刚在Jupyter上做的代码。

正如你所看到的,我用一些"噪音生成一些数据"然后将其与sklearn.linear_model.LinearRegression相符。然后我得到我的系数(+截距),你看到回归实际上是x.coeff +截距,如果我是正确的,那么你是K1*F1

from sklearn.linear_model import LinearRegression
import numpy as np
from matplotlib import pyplot as plt

noise = 2

lr = LinearRegression()
x, y = [], []
i=0
while i<10:
    for j in range(np.random.randint(1,5)):
        x.append(i)
        y.append(i+np.random.rand()*noise+(noise/2))
    i+=np.random.rand()

%matplotlib inline
plt.scatter(x, y)

x = np.asarray(x).reshape(-1, 1)
y = np.asarray(y).reshape(-1)

lr.fit(x,y)
plt.plot(x, np.multiply(x, lr.coef_[0])+lr.intercept_)

Linear Regression